GitXplorerGitXplorer
A

dataset_tools

public
4 stars
0 forks
0 issues

Commits

List of commits on branch main.
Unverified
c30c622777674cf217e631ba600355bb140cce16

增加声道转换

AArtrajz committed 10 months ago
Unverified
9e827a781cfa3f4f93c9c7d46b0f21fbd1b5e240

docs

AArtrajz committed a year ago
Unverified
024badf62dfe0c812eab6393b1383ce400e082a8

友链

AArtrajz committed a year ago
Unverified
e9dfa875845a5e05258bb1c39896013ba51d0d4a

更新安装ffmpeg说明

AArtrajz committed a year ago
Unverified
197bb109505210b62bae6ad3a788e763524b4cfb

如果中间停顿过长则用1s静音代替

AArtrajz committed a year ago
Unverified
ecfec48d40f3ae6dd87554403699e6043076e993

任务分成短音频和长音视频任务

AArtrajz committed a year ago

README

The README file for this repository.

自用的一些小脚本,针对Bert-VITS2的中文,稍微改改输出格式也可以用在其他VITS,有些参数写死但懒得改了……

使用的是FunASR以及modelscope模型仓库

任务1:重采样和格式转换->标注->简单清洗->标点恢复

任务2:重采样和格式转换->标注(带标点)和将长音视频切分短音频->简单清洗

也可以尝试其他佬的项目

Dataset_Generator_For_VITS

otty-tts-auto_datalabeling

安装依赖

建议使用python 3.8

conda create -n datasets_tools python==3.8
conda activate datasets_tools

使用cuda加速,需要提前装好cuda环境。

安装ffmpeg

pip install torch==2.0.1+cu117 torchvision==0.15.2+cu117 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu117
pip install funasr -i https://mirror.sjtu.edu.cn/pypi/web/simple
pip install modelscope -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install hdbscan umap joblib==1.1.0 ffmpeg-python --index-url https://pypi.tuna.tsinghua.edu.cn/simple --extra-index-url https://pypi.artrajz.cn/simple --prefer-binary

依赖可能没写完整,缺啥装啥

使用

可以分开执行需要的脚本,也可以直接运行main.py全部执行