【AI视野·今日Sound 声学论文速览 第九期】Thu, 21 Sep 2023

news/2024/7/23 11:57:06 标签: 人工智能, 音频, text2audio, audio2text, 声音

AI视野·今日CS.Sound 声学论文速览
Thu, 21 Sep 2023
Totally 1 papers
👉上期速览✈更多精彩请移步主页

Interesting:

📚Auto-ACD,大规模文本-音频数据集自动生成方法。
基于现有的大模型和api构建了一套大规模高质量的音频文本数据收集方法,包含1.9M audio-text 数据对。 (from 上海交大)
在这里插入图片描述
在这里插入图片描述

👍 👍 website: https://auto-acd.github.io/


Daily Sound Papers

A Large-scale Dataset for Audio-Language Representation Learning
Authors Luoyi Sun, Xuenan Xu, Mengyue Wu, Weidi Xie
在大规模多模式数据集的推动下,人工智能社区在开发强大的基础模型方面取得了重大进展。然而,在音频表示学习领域,现有的音频语言数据集存在容量不足、内容简单和收集过程繁琐等局限性。为了应对这些挑战,我们提出了一种基于一系列公共工具或 API 的创新型自动音频字幕生成管道,并构建了一个大规模、高质量的音频语言数据集,称为 Auto ACD,包含超过 190 万个音频文本对。为了证明所提出的数据集的有效性,我们在数据集上训练了流行的模型,并展示了各种下游任务的性能改进,即音频语言检索、音频字幕、环境分类。此外,我们建立了一个新颖的测试集,并为音频文本任务提供了基准。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com


http://www.niftyadmin.cn/n/5042422.html

相关文章

c++23中的新功能之十四输入输出指针

一、介绍 在c的发展过程中,无论如何发展,c都尽量保持着与C语言的兼容,当然这也是它的一个特点。在实际的应用中,开发者经常遇到的一个问题是,如何把一个指针的值给传出来?有人会说,简单啊&…

CRM软件系统维护客户的主要方法

客户的重要性,相信每一个做企业的人都非常清楚。为了维护好客户,很多企业都使用CRM客户管理系统,建立“以客户为中心”的经营理念,提高企业客户服务水平,进而在提高客户满意度的同时提高企业的盈利。那么,企…

2023年中国研究生数学建模竞赛D题解题思路

为了更好的帮助大家第一天选题,这里首先为大家带来D题解题思路,分析对应赛题之后做题阶段可能会遇到的各种难点。 稍后会带来D题的详细解析思路,以及相关的其他版本解题思路 成品论文等资料。 赛题难度评估:A、B>C>E、F&g…

Python 3.10.9 Mac m1 无法安装grpc的解决办法

pip install airavata-mft-cli python3.10 -m venv venv source venv/bin/activate pip install grpcio1.47.0rc1 pip install grpcio-tools1.47.0rc1 然后就成了 python -m grpc_tools.protoc -I --python_out. --grpc_python_out. message.proto 参考文章: …

简单易上手的在windows部署cmake版paddledetection(c++)

一.下载源代码 官方地址: https://gitee.com/paddlepaddle/PaddleDetection 网盘: paddledetection 链接:https://pan.baidu.com/s/1g0z5SYQNDR1pwe9iAtvR3A?pwdktl6 提取码:ktl6 paddleocr 链接:https://pan.baid…

腾讯面试题:无网络环境,如何部署Docker镜像?

亲爱的小伙伴们,大家好!我是小米,很高兴再次和大家见面。今天,我要和大家聊聊一个特别有趣的话题——腾讯面试题:无网络环境,如何部署Docker镜像?这可是一个技术含量颇高的问题哦!废…

SQL注入脚本编写

文章目录 布尔盲注脚本延时注入脚本 安装xampp,在conf目录下修改它的http配置文件,如下,找到配置文件: 修改配置文件中的默认主页,让xampp能访问phpstudy的www目录,因为xampp的响应速度比phpstudy快得多&am…

Android中的缓存策略:LruCache和DiskLruCache

Android中的缓存策略:LruCache和DiskLruCache 导言 本篇文章主要是介绍Android中内置的两个缓存类的原理。所谓缓存,就是将获取的数据保存下来以便下次继续使用,这种技术尤其在网络请求和图片加载中有用,可以显著地提升App的性能…