web-dev-qa-db-ja.com

Azure Data Factoryで.xlsxおよび.xls拡張子を持つファイルを読み取る方法は?

Azureデータファクトリデータセットの.xlsx拡張子が付いたAzure Blob StorageのExcelファイルを読み取ろうとしています。次のエラーをスローします

Error found when processing 'Csv/Tsv Format Text' source 'Filename.xlsx' with row number 3: found more columns than expected column count: 1.

Azure Data Factoryで読み取られるExcelファイルの正しい列と行の区切り文字は何ですか

5

Azure Data Factoryには、Excelをアップロードする直接のオプションはありませんが、一部の構成を介してリンクされたサービスを介してをアップロードできます。以下の手順に従ってください。

  1. 適切なプロトコル(FTP、Fileshare、SFTPなど)を使用して、ソースへのリンクされたサービスを作成します。
  2. クラウドストレージへのリンクされたサービスを作成します。
  3. データのコピーアクティビティを実行し、以前に定義したリンクされたサービスを使用してファイルシステムのソースデータセットとシンクを定義します
  4. ソースとシンクで、バイナリファイルオプションにチェックマークを付けます。 バイナリファイルオプション
  5. パイプラインを公開して実行する
0
user2029350

オプション3についてもう少し詳しく説明したいと思います。SSISパッケージ。私は解決策をテストしましたが、うまくいきました。まず第一に-SSIS IRは非常に高価であり、あなたは http post's to start-stop を使用したいのですが、それは必要ありません。

第2に、SSISは、そのままではblobファイルの処理をサポートしていません。それを回避する方法はいくつかあります。あなたはいくつかのサードパーティのソフトを使用することができます(それを試しませんでした)、または オプションを探す

私の場合、ファイルをローカルにダウンロードするパッケージを展開し、処理してから削除するためにトリックを使用しました。 SSIS IRはVMであるため、展開後のIRでも基本的に同じです。これは解決策というよりはトリックであり、100%安定していませんでした。別の問題-数値フィールドは、処理中に重要でないエラーを受け取りました。 25をアップロードすると、dbサイトで25.0000000001になります。なぜだかわかりません。問題をより深く調査するのに十分な時間がありませんでした。

0
nokufano