Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения:среда выполнения интеграции SSIS SQL Server
в Фабрика данных Azure
Источник Гибкая работа с файлами позволяет пакету служб SSIS считывать данные из различных поддерживаемых служб хранилища. Сейчас поддерживаются службы хранилища
Чтобы отобразить редактор источника "Гибкая работа с файлами", перетащите источник Гибкая работа с файлами в конструктор потока данных и дважды щелкните его, чтобы открыть редактор.
Источник Гибкая работа с файлами входит в состав пакета дополнительных компонентов SQL Server Integration Services (SSIS) для Azure.
Доступны следующие свойства редактора "Гибкая работа с файлами".
- Тип файла диспетчер подключений: указывает тип диспетчера исходных соединений. Затем выберите один из указанных типов или создайте новый.
- Путь к папке: указывает путь к исходной папке.
- Имя файла: указывает имя исходного файла.
- Формат файла: задает формат исходного файла. Поддерживаемые форматы: текст, Avro, ORC, Parquet. Java требуется для ORC/Parquet. Дополнительные сведения см. в разделе "Зависимость от Java".
- Символ разделителя столбцов: указывает символ, используемый в качестве разделителя столбцов (многозначные разделители не поддерживаются).
- Первая строка в качестве имени столбца: указывает, следует ли рассматривать первую строку как имена столбцов.
- Распаковка файла: указывает, следует ли распаковывать исходный файл.
- Тип сжатия: указывает формат сжатия исходного файла. Поддерживаемые форматы: GZIP, DEFLATE, BZIP2.
Доступны следующие свойства расширенного редактора.
- rowDelimiter: символ, используемый для разделения строк в файле. Допускается только один знак. Значение по умолчанию — \r\n.
- escapeChar: специальный символ, используемый для экранирования разделителя столбцов в содержимом входного файла. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
- quoteChar: символ, используемый для кавычки строкового значения. Разделители столбцов и строк внутри знаков кавычек будут рассматриваться как часть строкового значения. Это свойство применяется к входному и выходному наборам данных. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
- nullValue: один или несколько символов, используемых для представления значения NULL. Значением по умолчанию является \N.
- encodingName: укажите имя кодирования. См. раздел Encoding.EncodingName.
- skipLineCount: указывает количество непустых строк, которые нужно пропустить при чтении данных из входных файлов. Если указаны skipLineCount и firstRowAsHeader, то сначала пропускаются строки, а затем считываются данные заголовка из входного файла.
- treatEmptyAsNull: указывает, следует ли рассматривать null или пустую строку как значение NULL при чтении данных из входного файла. Значение по умолчанию — true.
Указав сведения о соединении, переключитесь на страницу Столбцы, чтобы сопоставить столбцы источника со столбцами назначения для потока данных служб SSI.
Примечания о настройке разрешений для субъекта-службы
Для работы тестового подключения (к хранилищу BLOB-объектов или Data Lake Storage 2-го поколения) субъекту-службе следует назначить по крайней мере роль Читатель данных в хранилище BLOB-объектов в учетной записи хранения. Это осуществляется посредством управление доступом на основе ролей (RBAC).
Для хранилища BLOB-объектов разрешение на чтение предоставляется путем назначения по крайней мере роли Читатель данных в хранилище BLOB-объектов.
Для Data Lake Storage 2-го поколения разрешение определяется как посредством управления доступом на основе ролей (RBAC), так и с помощью списков управления доступом (ACL). Обратите внимание, что списки управления доступом настроены с помощью идентификатора объекта (OID) субъекта-службы для регистрации приложения. Узнайте , как правильно задать списки управления доступом для субъекта-службы? Это отличается от идентификатора приложения (клиента), используемого с конфигурацией RBAC. Когда субъекту безопасности предоставляются разрешения на данные RBAC посредством встроенной или пользовательской роли, эти разрешения сначала оцениваются при авторизации запроса. Если запрошенная операция разрешена в соответствии с назначенными субъекту безопасности ролями RBAC, авторизация происходит немедленно и дополнительные проверки ACL не проводятся. Если же субъекту безопасности роль RBAC не назначена или если запрошенная операция не соответствует предоставленному разрешению, проводятся проверки ACL, цель которых — определить, разрешено ли субъекту безопасности выполнять запрошенную операцию. Для разрешения на чтение необходимо предоставить по крайней мере разрешение на выполнение начиная с исходной файловой системы, а также разрешение на чтение целевых файлов. Можно также предоставить разрешение не ниже чтения данных из хранилища BLOB-объектов с помощью RBAC. Подробные сведения см. в этой статье.