Skip to content

识别自定义内容

在这个教程中将会教你如何在 ACRCloud 平台创建一个服务,来给你的应用程序添加自定义内容识别的功能。

这个服务需要会编程, 如果你不会编程请使用 文件扫描

创建资源库

  1. 登录 ACRCloud 控制台

  2. 在控制台首页选择 「音频指纹识别」点击进入 AVR 控制台

home_avr

  1. 依次点击 资源库 -> 音视频 -> 创建资源库

home_avr

  1. 根据自身需求填写表单。

TIP

网络类型:

在线,音频指纹库建立在 ACRCloud。优点:可以实时更新内容。缺点:需要联网。

离线,音频指纹库建立在用户自己设备。优点:无需网络,所有计算在用户设备执行。 缺点:无法实时更新内容。

上传文件到资源库

如果你想自定义上传到资源库的文件的 metadata 并且附加一些其他文本信息,请选择 「上传」

如果你想直接上传到资源库,将文件名当做唯一的metadata,请选择 「快速上传」

upload_file_to_bucket

上传之后,等待一会刷新页面,状态变成「就绪」时,此内容可被识别。

如果你需要上传大量的内容,请使用 提取音频指纹工具 在你的本地将你的内容提取出指纹之后再通过 平台接口 上传,这将会极大的减少你上传的带宽。如果您在上传过程中需要帮助,请联系 support@acrcloud.com

创建识别服务

  1. 登录 ACRCloud 控制台

  2. 在控制台首页选择 「音频指纹识别」点击进入 AVR 控制台

home_avr

  1. 依次点击 项目 -> 音视频识别 -> 创建项目

create_service_custom

  1. 根据自身需求填写表单。

TIP

  • 音频类型:这里要注意你的使用场景,如果你是通过麦克风录音识别周围环境中的音乐请选择「通过麦克风采集的音频(包含噪音)」, 如果你的音频质量很好非常清晰,请使用「原始文件或流媒体(未包含噪音)」

  • 资源库:本篇教程识别自定义内容,这里需要选择你之前创建的资源库

保存服务配置

保存项目的 "host","access_key","access_secret" 以备之后使用。您可以在下面的位置找到它们。 service_key

集成到你自己的应用中

使用移动 SDK,后端 SDK,识别 API 或文件扫描工具。你可以在这个页面上找到所有的 SDK 和工具。

TIP

识别接口一次最多可以接受 10 秒的音频长度,如果你想要识别整个文件或者文件不同位置需要多次请求完成这个操作。

创建容器

  1. 登录 ACRCloud 控制台

  2. 在控制台首页选择 「文件扫描」点击进入文件扫描控制台

home_avr

  1. 依次点击 文件容器 -> 创建

    filescanning_container

  2. 根据自身需求填写表单。

TIP

  • 音频识别引擎: 自定义内容只能使用「音频指纹」;

  • 音频类型:这里要注意你的使用场景,如果你是通过麦克风录音识别周围环境中的音乐请选择「通过麦克风采集的音频(包含噪音)」, 如果你的音频质量很好非常清晰,请使用「原始文件或流媒体(未包含噪音)」

  • 资源库:本篇教程识别自定义内容,这里需要选择你之前创建的资源库

  • 扫描策略: 遍历扫描会扫描整个文件,适用于文件包含多个内容或者知道一个内容播放了多久;点式扫描将会挑选三段 10 秒识别,适用于文件只有一个内容或者抽查的情况;

  1. 进入文件容器,点击上传,等待上传和扫描完成。

uploadfile

  1. State 为就绪时,点开文件,查看音频指纹的结果。

  2. 导出成报表.

export_report