
在科技迅速发展确当下,东谈主工智能范围的每一次打破齐能激发泛泛矜恤。2 月 6 日,字节高出盘问团队负责发布全新 AI 数字东谈主模子 OmniHuman,这一音问斯须在行业内掀翻海潮。
OmniHuman 是一款端到端的多模态模子,其最大亮点在于冒昧从单张像片生成传神全身动态视频,不错对任性尺寸和东谈主物占比的单张图片运筹帷幄一段输入的音频进行视频生成,生成的东谈主物视频成果活泼,具有绝顶高的当然度。OmniHuman通过引入多模态条款开动和全条款历练计谋,告捷处罚了东谈主类动画生成范围恒久存在的数据推广和泛化智力问题。
OmniHuman 选拔基于 DiT 架构的多模态通顺条款夹杂历练计谋,将扩散模子和 Transformer 相运筹帷幄,扫尾高质料图像生成和细节精确限度,还能交融文本、音频、姿势等多模态信息。这种 “全条款” 历练阵势,让模子从更泛泛的数据围聚学习,灵验处罚了传统数字东谈主模子历练信息单一、泛化智力不及的问题。
从控制层面来看,OmniHuman 有着纷乱的后劲。关于个东谈主创作家和 MCN 机构,它极大镌汰了实质创作门槛,不错快速生成造谣主播、造谣偶像、造谣客服、造谣教化等各类数字东谈主实质。
跟着 OmniHuman 的发布,2月7日,AI数字东谈主意见股大幅上升。 齐门在线盘中大涨20.03%,逐日互动、恒银科技、若羽臣涨幅均超10%,天娱数科、软通能源等涨幅居前。