连接到 John Snow Labs

John Snow Labs 通过以下产品在自然语言处理 (NLP) 中提供生产级、可缩放、可训练版本的最新研究成果:

  • Spark NLP:适用于 Python、Java 或 Scala 的一流 NLP。
  • Spark NLP for Healthcare:一流的临床和生物医学 NLP。
  • Spark OCR:可缩放、专用且高度准确的 OCR 和去标识化库。

可将 Azure Databricks 群集与 John Snow Labs 集成。

注意

John Snow Labs 不与 Databricks SQL 仓库(以前称为 Databricks SQL 终结点)集成。

手动连接到 John Snow Labs

按照这些说明在群集上自动安装 John Snow Labs NLP 和 OCR 库以及笔记本,并激活试用版 John Snow Labs(如果你还没有 John Snow Labs 帐户)。

要求

在与 John Snow Labs 集成之前,必须做好以下准备:

  • Azure Databricks 工作区中的 Azure Databricks 群集

  • 一个 Azure Databricks 个人访问令牌

    注意

    作为安全最佳做法,在使用自动化工具、系统、脚本和应用进行身份验证时,Databricks 建议使用属于服务主体(而不是工作区用户)的个人访问令牌。 若要为服务主体创建令牌,请参阅管理服务主体的令牌

过程

要与 John Snow Labs 集成,请完成以下步骤:

  1. 确保满足 John Snow Labs 的要求

  2. 转到 Databricks 上的 John Snow Labs NLP 网页。

  3. 单击“在我的 Databricks 帐户中安装”。

  4. 在“请自我介绍”对话框中,输入你的名字、姓氏和公司电子邮件地址。

  5. 对于“Databricks 实例 URL”,请输入你的 Azure Databricks 工作区 URL,例如 https://adb-1234567890123456.7.databricks.azure.cn/?o=1234567890123456

  6. 对于“Databricks 访问令牌”,请输入本文要求部分中所述的令牌值。

  7. 单击“测试连接”。

  8. 连接成功后,对于“选择要安装到的群集”,请选择本文要求部分中所述的群集。

  9. 单击“获取试用许可证”。

  10. 检查电子邮件收件箱中是否收到了来自 John Snow Labs 的邮件,其中包含验证电子邮件地址的请求。

  11. 在该邮件中,单击“验证我的电子邮件”。

  12. 几分钟后,再次检查电子邮件收件箱中是否收到了来自 John Snow Labs 的另一封邮件,其中包含有关如何开始使用的说明。 请注意,在某些情况下,可能需要在长达半小时之后才能收到此邮件。

  13. 按照消息中的说明进行操作。

    注意

    若要在群集上手动安装 John Snow Labs 库和笔记本,请参阅 John Snow Labs 网站上的以下资源:

  14. 要升级试用版 John Snow Labs,请在 https://my.johnsnowlabs.com/login 上登录到你的 John Snow Labs 帐户。

  15. 继续执行后续步骤。

后续步骤

在 John Snow Labs 网站上浏览以下一个或多个资源: