当前位置: 欣欣网 > 码农

推荐 3 个 火火火火 的 AI 开源项目

2024-01-26码农

本期推荐开源项目目录:

1. GPT-SoVITS

2. 以代码为主的代理框架

3. ChatGPT、文生图 API 封装应用

01

GPT-SoVITS

GPT-SoVITS 是一个开源黑科技,只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。

它具有以下主要特性:

  • 零样本 TTS:输入 5 秒的声音样本,即可体验即时的文本到语音转换。

  • 少样本 TTS:只需 1 分钟的训练数据,就可以微调模型,以提高语音相似度和真实感。

  • 跨语言支持:可以用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。集成了一些工具,包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签,帮助初学者创建训练数据集和 GPT/SoVITS 模型。

    开源地址:https://github.com/RVC-Boss/GPT-SoVITS

    02

    以代码为主的代理框架

    TaskWeaver 是一个由 Microsoft 开发的开源项目,它是一个以代码为主的代理框架,用于无缝地规划和执行数据分析任务。

    TaskWeaver 的目标是通过编码片段解释用户请求,并有效地协调各种形式的插件(函数)来执行数据分析任务。这是一个以代码为主的代理框架,可以无缝地规划和执行数据分析任务。

    开源地址: https://github.com/microsoft/TaskWeaver

    03

    ChatGPT、文生图 API 封装应用

    该开源项目叫做 chatgpt-web-midjourney-proxy 目前已经获得了 1.1k 的 Star,该项目是在 ChenZhaoYu 的基础上进行二次开发的,使用 midjourney-proxy 提供的 midjourney api 作为后端。

    部署后,可以在基于该开源项目体验 ChatGPT、Midjourney 的功能。如下是该项目支持的功能:

    开源地址: https://github.com/Dooy/chatgpt-web-midjourney-proxy

    录音 whisper 和 tts

    局部重绘

    换脸

    混图

    历史盘点

    逛逛 G itHub 每 天推荐一个好玩有趣的开源项目。 历史推荐的开源项目已经收录到 GitHub 项目,欢迎 Star:

    地址:https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo


    推荐阅读

    1.

    2.

    3.

    4.