deepfacelab中文网

 找回密码
 立即注册(仅限QQ邮箱)
查看: 1316|回复: 7

HeyGem.ai,一张图免费开源的数字人带货大模型,本地运行

[复制链接]

6

主题

55

帖子

882

积分

高级丹师

Rank: 5Rank: 5

积分
882
 楼主| 发表于 2025-3-19 10:52:56 | 显示全部楼层 |阅读模式
星级打分
  • 1
  • 2
  • 3
  • 4
  • 5
平均分:NAN  参与人数:0  我的评分:未评

需要翻墙
github地址:https://github.com/GuijiAI/HeyGem.ai
可以的话,给我2个灵石打赏吧
image.png
建议配置如下
image.png



Heygem 是一款专为 Windows 系统设计的完全离线视频合成工具,可以精确克隆您的外貌和声音,将您的形象数字化。您可以通过文字和语音驱动虚拟化身来制作视频。无需网络连接,在保护隐私的同时享受便捷高效的数字体验。


Heygem is a fully offline video synthesis tool designed for Windows systems that can precisely clone your appearance and voice, digitalizing your image. You can create videos by driving virtual avatars through text and voice. No internet connection is required, protecting your privacy while enjoying convenient and efficient digital experiences.
Heygem 是一款专为 Windows 系统设计的完全离线视频合成工具,可以精确克隆您的外貌和声音,将您的形象数字化。您可以通过文字和语音驱动虚拟化身来制作视频。无需网络连接,在保护隐私的同时享受便捷高效的数字体验。
  • Core Features   核心功能
    • Precise Appearance and Voice Cloning: Using advanced AI algorithms to capture human facial features with high precision, including facial features, contours, etc., to build realistic virtual models. It can also precisely clone voices, capturing and reproducing subtle characteristics of human voices, supporting various voice parameter settings to create highly similar cloning effects.
      精准外貌与语音克隆:利用先进的AI算法,高精度捕捉人体五官、轮廓等特征,构建逼真的虚拟模型。还能精准克隆语音,捕捉并重现人声的细微特征,支持多种语音参数设置,打造高度相似的克隆效果。
    • Text and Voice-Driven Virtual Avatars: Understanding text content through natural language processing technology, converting text into natural and fluent speech to drive virtual avatars. Voice input can also be used directly, allowing virtual avatars to perform corresponding actions and facial expressions based on the rhythm and intonation of the voice, making the virtual avatar's performance more natural and vivid.
      文字及语音驱动的虚拟化身:通过自然语言处理技术理解文本内容,将文本转化为自然流畅的语音来驱动虚拟化身。也可直接使用语音输入,让虚拟化身根据语音的节奏、语调做出相应的动作和表情,使虚拟化身的表现更加自然生动。
    • Efficient Video Synthesis: Highly synchronizing digital human video images with sound, achieving natural and smooth lip-syncing, intelligently optimizing audio-video synchronization effects.
      高效视频合成:数字人视频画面与声音高度同步,实现自然流畅的口型同步,智能优化音视频同步效果。
    • Multi-language Support: Scripts support eight languages - English, Japanese, Korean, Chinese, French, German, Arabic, and Spanish.
      多语言支持:脚本支持八种语言 - 英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
  • Key Advantages   主要优势
    • Fully Offline Operation: No internet connection required, effectively protecting user privacy, allowing users to create in a secure, independent environment, avoiding potential data leaks during network transmission.
      完全离线操作:无需网络连接,有效保护用户隐私,让用户在安全、独立的环境中进行创作,避免网络传输过程中潜在的数据泄露。
    • User-Friendly: Clean and intuitive interface, easy to use even for beginners with no technical background, quickly mastering the software's usage to start their digital human creation journey.
      用户友好:界面干净直观,即使没有技术背景的初学者也可以轻松使用,快速掌握软件的使用方法,开始他们的数字人类创作之旅。
    • Multiple Model Support: Supports importing multiple models and managing them through one-click startup packages, making it convenient for users to choose suitable models based on different creative needs and application scenarios.
      多模型支持:支持导入多种模型并通过一键启动包进行管理,方便用户根据不同的创作需求和应用场景选择合适的模型。
  • Technical Support   技术支援
    • Voice Cloning Technology: Using advanced technologies like artificial intelligence to generate similar or identical voices based on given voice samples, covering context, intonation, speed, and other aspects of speech.
      语音克隆技术:利用人工智能等先进技术,根据给定的语音样本生成相似或相同的声音,涵盖上下文、语调、速度等语音方面。
    • Automatic Speech Recognition: Technology that converts human speech vocabulary content into computer-readable input (text format), enabling computers to "understand" human speech.
      自动语音识别:将人类语音词汇内容转换为计算机可读输入(文本格式)的技术,使计算机能够“理解”人类语音。
    • Computer Vision Technology: Used in video synthesis for visual processing, including facial recognition and lip movement analysis, ensuring virtual avatar lip movements match voice and text content.
      计算机视觉技术:用于视频合成进行视觉处理,包括面部识别和唇部运动分析,确保虚拟化身唇部动作与语音和文本内容相匹配。


回复

使用道具 举报

5

主题

48

帖子

1543

积分

初级丹圣

Rank: 8Rank: 8

积分
1543
发表于 2025-3-20 00:26:52 | 显示全部楼层
发一个百度网盘吧
回复 支持 反对

使用道具 举报

6

主题

55

帖子

882

积分

高级丹师

Rank: 5Rank: 5

积分
882
 楼主| 发表于 2025-3-20 17:57:17 | 显示全部楼层

没得网盘会员,太慢了整不动
回复 支持 反对

使用道具 举报

6

主题

55

帖子

882

积分

高级丹师

Rank: 5Rank: 5

积分
882
 楼主| 发表于 2025-3-21 10:56:46 | 显示全部楼层
Heygem.ai核心亮点

即刻生成,无需训练: 无需数字人训练,30秒内克隆形象声音,60秒内合成视频,最快推理速度达1:0.5,视频渲染合成速度达1:2。

1秒视频,极速克隆:1秒视频或1张照片,即刻生成数字人

4K电影级画质:4K超高清、32帧/秒,超越好莱坞电影24帧标准
回复 支持 反对

使用道具 举报

6

主题

55

帖子

882

积分

高级丹师

Rank: 5Rank: 5

积分
882
 楼主| 发表于 2025-3-21 13:56:40 | 显示全部楼层

  你看下这个这也是数字人
回复 支持 反对

使用道具 举报

14

主题

42

帖子

4215

积分

高级丹圣

Rank: 13Rank: 13Rank: 13Rank: 13

积分
4215
发表于 2025-3-23 07:31:52 | 显示全部楼层
大哥 下载后58M没有看到可执行文件啊
回复 支持 反对

使用道具 举报

6

主题

55

帖子

882

积分

高级丹师

Rank: 5Rank: 5

积分
882
 楼主| 发表于 2025-3-24 10:18:15 | 显示全部楼层
play_g 发表于 2025-3-23 07:31
大哥 下载后58M没有看到可执行文件啊

不应该啊,应该是有的。我下载看了一下
回复 支持 反对

使用道具 举报

0

主题

13

帖子

112

积分

高级丹童

Rank: 2

积分
112
发表于 2025-4-1 16:06:52 | 显示全部楼层

超牛逼的数字人生成软件,刘悦大佬杰作,windouws下直接运行,生成速度快,嘴型清晰,链接:https://pan.quark.cn/s/6f7e8244b5c9
回复 支持 反对

使用道具 举报

QQ|Archiver|手机版|deepfacelab中文网 |网站地图

GMT+8, 2025-5-17 23:56 , Processed in 0.114144 second(s), 35 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表