快速入门:使用 Python SDK 和 Azure Cosmos DB 构建 Cassandra 应用

适用对象: Cassandra

在本快速入门中,你将创建一个 Azure Cosmos DB for Apache Cassandra 帐户,并使用从 GitHub 克隆的 Cassandra Python 应用创建一个 Cassandra 数据库和一个容器。 Azure Cosmos DB 是一种多模型数据库服务,可让你通过多区域分布和水平缩放功能快速创建和查询文档、表、键/值和图数据库。

先决条件

创建数据库帐户

在创建文档数据库之前,需通过 Azure Cosmos DB 创建 Cassandra 帐户。

  1. 在 Azure 门户菜单或主页中,选择“创建资源” 。

  2. 在“新建”页面中搜索“Azure Cosmos DB”,然后选择它。

  3. 在“Azure Cosmos DB”页上,选择“创建”。

  4. API 页面上,选择 Cassandra 下的“创建”。

    API 确定要创建的帐户的类型。 Azure Cosmos DB 提供五种 API:适用于文档数据库的 NoSQL、适用于图形数据库的 Gremlin、适用于文档数据库的 MongoDB、Azure 表和 Cassandra。 必须为每种 API 创建单独的帐户。

    选择“Cassandra”,因为本快速入门将创建使用 API for Cassandra 的表。

    详细了解 API for Cassandra

  5. 在“创建 Azure Cosmos DB 帐户”页中,输入新 Azure Cosmos DB 帐户的基本设置。

    设置 说明
    订阅 订阅 选择要用于此 Azure Cosmos DB 帐户的 Azure 订阅。
    资源组 新建

    然后,输入与帐户名称相同的名称。
    选择“新建”。 然后输入帐户的新资源组名称。 为简单起见,请使用与 Azure Cosmos DB 帐户名称相同的名称。
    帐户名 输入唯一的名称 输入标识此 Azure Cosmos DB 帐户的唯一名称。 帐户 URI 将是追加到唯一帐户名称的“cassandra.cosmos.azure.cn” 。

    帐户名称只能使用小写字母、数字及连字符 (-),必须为 3 到 31 个字符长。
    API Cassandra API 确定要创建的帐户的类型。 Azure Cosmos DB 提供五种 API:适用于文档数据库的 NoSQL、适用于图形数据库的 Gremlin、适用于文档数据库的 MongoDB、Azure 表和 Cassandra。 必须为每种 API 创建单独的帐户。

    选择“Cassandra”,因为本快速入门将创建使用 API for Cassandra 的表。

    详细了解 API for Cassandra
    位置 离用户最近的区域 选择用于托管 Azure Cosmos DB 帐户的地理位置。 使用离用户最近的位置,使他们能够以最快的速度访问数据。
    容量模式 预配吞吐量或无服务器 选择“预配吞吐量”以在预配吞吐量模式下创建帐户。 选择“无服务器”以在无服务器模式下创建帐户。
    应用 Azure Cosmos DB 免费层折扣 “应用”或“不应用” 使用 Azure Cosmos DB 免费层,你将在帐户中获得每秒前 1000 RU 的免费吞吐量和 25 GB 的免费存储。 了解免费层的详细信息。

    注意

    每个 Azure 订阅最多可以有一个免费层 Azure Cosmos DB 帐户,并且你必须在创建帐户时选择加入使用。 如果看不到用于应用免费层折扣的选项,这意味着订阅中的另一个帐户已启用免费层。

    The new account page for Azure Cosmos DB for Apache Cassandra

  6. 在“全局分发”选项卡中,配置以下详细信息。 对于本快速入门,可以保留默认值:

    设置 说明
    异地冗余 禁用 通过将你的区域与某个配对区域进行配对来启用或禁用帐户的多区域分发。 稍后可以将更多区域添加到帐户。
    多区域写入 禁用 借助多区域写入功能,可以利用全中国的数据库和容器的预配吞吐量。
    可用性区域 禁用 可用性区域是指 Azure 区域内的隔离区域。 每个区域由一个或多个数据中心组成,这些数据中心配置了独立电源、冷却和网络。

    注意

    如果选择“无服务器”作为“容量模式”,则以下选项不可用 :

    • 应用免费层折扣
    • 异地冗余
    • 多区域写入
  7. (可选)可以在以下选项卡中配置其他详细信息:

    • 网络 - 配置来自虚拟网络的访问
    • 备份策略- 配置定期连续备份策略。
    • 加密 - 使用服务管理的密钥或客户管理的密钥
    • 标记 - 标记是名称/值对,通过将相同的标记应用到多个资源和资源组,可以对资源进行分类并查看合并的账单。
  8. 选择“查看 + 创建”。

  9. 检查帐户设置,然后选择“创建”。 创建帐户需要几分钟时间。 等待门户页显示“你的部署已完成”消息。

    The Azure portal Notifications pane

  10. 选择“转到资源”,转到 Azure Cosmos DB 帐户页。

克隆示例应用程序

现在从 GitHub 克隆 API for Cassandra 应用、设置连接字符串并运行应用。 你会发现以编程方式处理数据是多么容易。

  1. 打开命令提示符。 创建名为 git-samples 的新文件夹。 然后,关闭命令提示符。

    md "C:\git-samples"
    
  2. 打开诸如 git bash 之类的 git 终端窗口,并使用 cd 命令更改为要安装示例应用的新文件夹。

    cd "C:\git-samples"
    
  3. 运行下列命令,克隆示例存储库。 此命令在计算机上创建示例应用程序的副本。

    git clone https://github.com/Azure-Samples/azure-cosmos-db-cassandra-python-getting-started.git
    

查看代码

此步骤是可选的。 如果有意了解如何通过代码创建数据库资源,可以查看以下代码片段。 这些代码片段全部摘自 pyquickstart.py 文件。 否则,可以直接跳转到更新连接字符串

  • 使用从 Azure 门户检索的 contactPointport 信息对 cluster 进行初始化。 然后,cluster 使用 connect() 方法连接到 Azure Cosmos DB for Apache Cassandra。 授权连接是通过使用用户名、密码和默认证书或显式证书(如果你在配置文件中提供了一个)来建立的。

    ssl_context = SSLContext(PROTOCOL_TLSv1_2)
    ssl_context.verify_mode = CERT_NONE
    auth_provider = PlainTextAuthProvider(username=cfg.config['username'], password=cfg.config['password'])
    cluster = Cluster([cfg.config['contactPoint']], port = cfg.config['port'], auth_provider=auth_provider,ssl_context=ssl_context)
    session = cluster.connect()
    
  • 创建新的键空间。

    print ("\nCreating Keyspace")
    session.execute('CREATE KEYSPACE IF NOT EXISTS uprofile WITH replication = {\'class\': \'NetworkTopologyStrategy\', \'datacenter\' : \'1\' }');
    
  • 创建新表。

    print ("\nCreating Table")
    session.execute('CREATE TABLE IF NOT EXISTS uprofile.user (user_id int PRIMARY KEY, user_name text, user_bcity text)');
    
  • 插入键/值实体。

    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [1,'Lybkov','Seattle'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [2,'Doniv','Dubai'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [3,'Keviv','Chennai'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [4,'Ehtevs','Pune'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [5,'Dnivog','Belgaum'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [6,'Ateegk','Narewadi'])
    session.execute("INSERT INTO  uprofile.user  (user_id, user_name , user_bcity) VALUES (%s,%s,%s)", [7,'KannabbuS','Yamkanmardi'])
    
  • 用于获取所有键值的查询。

    print ("\nSelecting All")
    rows = session.execute('SELECT * FROM uprofile.user')
    PrintTable(rows)
    
  • 用于获取键-值的查询。

    print ("\nSelecting Id=1")
    rows = session.execute('SELECT * FROM uprofile.user where user_id=1')
    PrintTable(rows)
    

更新连接字符串

现在返回到 Azure 门户,获取连接字符串信息,并将其复制到应用。 连接字符串使应用能与托管数据库进行通信。

  1. Azure 门户的 Azure Cosmos DB 帐户中,选择“连接字符串”。

  2. 使用屏幕右侧的 按钮复制最上面的值“联系点”。

    View and copy an access user name, password and contact point in the Azure portal, connection string blade

  3. 打开 config.py 文件。

  4. 粘贴门户中的“联系点”值,并覆盖第 10 行中的 <FILLME>

    第 10 行现在应如下所示

    'contactPoint': 'cosmos-db-quickstarts.cassandra.cosmos.azure.cn'

  5. 将门户中的 PORT 值粘贴到第 12 行上的 <FILLME>

    第 12 行现在应类似于

    'port': 10350,

  6. 复制并粘贴门户中的“用户名”值,并覆盖第 6 行中的 <FILLME>

    第 6 行现在应如下所示

    'username': 'cosmos-db-quickstart',

  7. 复制并粘贴门户中的“密码”值,并覆盖第 8 行中的 <FILLME>

    第 8 行现在应如下所示

    'password' = '2Ggkr662ifxz2Mg==';`

  8. 保存 config.py 文件。

运行 Python 应用

  1. 使用 git 终端中的 cd 命令更改到 azure-cosmos-db-cassandra-python-getting-started 文件夹。

  2. 运行以下命令安装所需的模块:

    python -m pip install cassandra-driver==3.20.2
    python -m pip install prettytable
    python -m pip install requests
    python -m pip install pyopenssl
    

    注意

    建议将 Python 驱动程序版本 3.20.2 用于 API for Cassandra。 如果使用更高版本,可能会导致出错。

  3. 运行以下命令启动 Python 应用程序:

    python pyquickstart.py
    
  4. 通过命令行验证结果是否符合预期。

    按 CTRL+C 停止执行程序并关闭控制台窗口。

    View and verify the output

  5. 在 Azure 门户中,打开数据资源管理器,以查询、修改和处理这些新数据。

    View the data in Data Explorer

在 Azure 门户中查看 SLA

Azure 门户可监视 Azure Cosmos DB 帐户吞吐量、存储、可用性、延迟和一致性。 与 Azure Cosmos DB 服务级别协议 (SLA) 关联的指标的图表显示与实际性能相比的 SLA 值。 此套指标使得监视 SLA 十分透明。

若要查看指标和 SLA,请执行以下操作:

  1. 请在 Azure Cosmos DB 帐户的导航菜单中选择“指标”。

  2. 选择一个选项卡,如“延迟”,然后选择右侧的时间范围。 比较图表上的“实际”和“SLA”线。

    Azure Cosmos DB metrics suite

  3. 查看其他选项卡上的指标。

清理资源

执行完应用和 Azure Cosmos DB 帐户的操作以后,可以删除所创建的 Azure 资源,以免产生更多费用。 若要删除资源,请执行以下操作:

  1. 在 Azure 门户的“搜索”栏中,搜索并选择“资源组” 。

  2. 从列表中选择为本快速入门创建的资源组。

    Select the resource group to delete

  3. 在资源组“概览”页上,选择“删除资源组” 。

    Delete the resource group

  4. 在下一窗口中输入要删除的资源组的名称,然后选择“删除” 。

后续步骤

本快速入门介绍了如何使用 API for Cassandra 创建 Azure Cosmos DB 帐户,以及如何运行用于创建 Cassandra 数据库和容器的 Cassandra Python 应用。 现在可将其他数据导入 Azure Cosmos DB 帐户中。