文本分析(预览版)
在文本数据中发现有意义的见解。 执行情绪分析、提取关键短语并从文本数据中清理 PII 数据。
此连接器在以下产品和区域中可用:
| 服务 | Class | 区域 |
|---|---|---|
| Copilot Studio | 高级 | 除以下各项外的所有 Power Automate 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| 逻辑应用程序 | 标准 | 除以下各项外的所有 逻辑应用区域 : - Azure 政府区域 - Azure 中国区域 - 美国国防部(DoD) |
| Power Apps | 高级 | 除以下各项外的所有 Power Apps 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| Power Automate | 高级 | 除以下各项外的所有 Power Automate 区域 : - 美国政府 (GCC) - 美国政府 (GCC High) - 由世纪互联运营的中国云 - 美国国防部(DoD) |
| 联系人 | |
|---|---|
| Name | MAQ 软件销售 |
| URL | https://maqsoftware.com/contact |
| Sales@MAQSoftware.com |
| 连接器元数据 | |
|---|---|
| 发布者 | MAQ Software |
| 网站 | https://maqsoftware.com/ |
| 隐私策略 | https://maqsoftware.com/privacystatement |
| 类别 | 人工智能;网站 |
MAQTextAnalytics 可用于使用自然语言处理模型处理原始文本。 此连接器支持情绪分析、提取关键短语和清理个人身份信息(PII)。
先决条件
注册 SDK
需要 O365 帐户才能注册:
- 单击此处使用“开发人员区域”窗格中的“免费试用版”按钮进行注册
- 保存在“开发人员区域”窗格中注册时收到的 API 密钥。 请记下订阅处于活动状态之前的有效性
现在,你已准备好开始使用此连接器。
Capabilities
情绪分析
分析原始文本的情绪。 此功能返回介于 0 和 1 之间的情绪分数,其中分数为 0 对应于负面情绪,分数为 1 对应于正情绪。 此外,分数为 0.5 对应于中性情绪。
关键短语提取
从原始文本中提取主要关键短语。 它输出每个关键短语,其重要性分数和最相似的关键短语。 此功能要求用户输入以下信息:
-
text:需要从中提取关键短语的输入文本 -
keyphraseCount:要返回的关键短语计数 -
diversityThreshold:多样性阈值的值可以介于 0 和 1 之间。 得分越多,关键短语就越不同/多样化。 分数越少,关键短语越重复。 -
aliasThreshold:别名阈值的值可以介于 0 和 1 之间。 别名/相似关键短语的相似性阈值。 值越多,更准确是顶级关键短语中的关键字短语。
清理 PII 数据
根据配置的实体从原始文本中清理个人身份信息(PII 数据)。 此功能要求用户输入以下信息:
-
text:需要从中清理 PII 实体的输入文本 -
entityList:实体的逗号分隔列表(请参阅下面的“受支持实体列表”部分)
用于清理 PII 数据的受支持实体列表:
| 实体名称 | Action |
|---|---|
| 人 | 完整人名,可以包括名字、中间名或首字母缩写和姓氏。 |
| CREDIT_CARD | 信用卡号介于 12 到 19 位之间。 https://en.wikipedia.org/wiki/Payment_card_number |
| DATE_TIME | 绝对或相对日期或周期或时间小于一天。 |
| DOMAIN_NAME | DNS 标准定义的域名。 |
| EMAIL_ADDRESS | 电子邮件地址标识电子邮件发送到的电子邮件地址框 |
| IBAN_CODE | 国际银行账户号码(IBAN)是一个国际商定的系统,用于识别跨国边界的银行账户,以促进跨境交易的沟通和处理,并降低听录错误的风险。 |
| IP_ADDRESS | Internet 协议 (IP) 地址(IPv4 或 IPv6)。 |
| 位置 | 政治或地理定义位置的名称(城市、省、国家/地区、国际区域、水体、山体) |
| PHONE_NUMBER | 电话号码 |
| US_BANK_NUMBER | 美国银行帐户号介于 8 到 17 位之间。 |
| US_DRIVER_LICENSE | 美国驾驶执照,根据 https://ntsi.com/drivers-license-format/ |
| US_PASSPORT | 包含 9 位数字的美国护照号码。 |
| US_SSN | 包含 9 位数字的美国社会保障号码(SSN)。 |
已知问题和限制
此连接器使用 MAQ 文本分析免费试用版提供的 API 密钥。 在免费试用订阅中,API 密钥的默认配额为 500 次调用。 在单个调用中,最多可以发送 1 个文档。
FAQ
API 密钥过期时会发生什么情况?
可以通过 单击此处重新注册免费试用版订阅。 有关详细信息,可以在以下位置 support@maqsoftware.com与我们联系。API 限制用尽时会发生什么情况?
尝试使用连接器时,将收到 API 限制超出错误。 可以访问 “开发人员区域 ”窗格并生成新的 API 密钥。 对于高级服务,可以在以下位置与我们联系 support@maqsoftware.com为什么收到批大小错误? 每个功能的单个调用中最多可以发送 1 个文档。 验证是否未尝试发送超过 1 个文档。
正在创建连接
连接器支持以下身份验证类型:
| 默认 | 用于创建连接的参数。 | 所有区域 | 不可共享 |
违约
适用:所有区域
用于创建连接的参数。
这是不可共享的连接。 如果 Power App 与另一个用户共享,系统会提示其他用户显式创建新连接。
| Name | 类型 | Description | 必选 |
|---|---|---|---|
| API 密钥 | securestring | 此 API 的 API 密钥 | True |
限制
| 名称 | 调用 | 续订期 |
|---|---|---|
| 每个连接的 API 调用数 | 100 | 60 秒 |
操作
| 关键短语提取程序 |
从文本数据中提取关键短语 |
| 情绪分类器 |
对文本数据执行情绪分析 |
| 清理 PII 数据 |
基于配置的实体从文本中清理 PII 数据 |
关键短语提取程序
从文本数据中提取关键短语
参数
| 名称 | 密钥 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
文本消息
|
text | string |
文本消息 |
|
|
keyphrases_count
|
keyphrases_count | integer |
keyphrases_count |
|
|
diversity_threshold
|
diversity_threshold | float |
diversity_threshold |
|
|
alias_threshold
|
alias_threshold | float |
alias_threshold |
返回
| 名称 | 路径 | 类型 | 说明 |
|---|---|---|---|
|
|
array of object | ||
|
KeyPhrase
|
KeyPhrase | string |
KeyPhrase |
|
得分
|
Score | float |
得分 |
|
类似
|
Similar | array of string |
类似 |
情绪分类器
对文本数据执行情绪分析
参数
| 名称 | 密钥 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
id
|
id | integer |
id |
|
|
文本消息
|
text | string |
文本消息 |
返回
| 名称 | 路径 | 类型 | 说明 |
|---|---|---|---|
|
|
array of object | ||
|
id
|
id | integer |
id |
|
情绪
|
sentiment | float |
情绪 |
清理 PII 数据
基于配置的实体从文本中清理 PII 数据
参数
| 名称 | 密钥 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
数据
|
data | string |
数据 |
|
|
entity_list
|
entity_list | string |
entity_list |
返回
| 名称 | 路径 | 类型 | 说明 |
|---|---|---|---|
|
scrubbed_text
|
scrubbed_text | string |
scrubbed_text |