《科创板日报》5月10日讯(记者 李明明) 工商资料显示,近日,北京生数科技有限公司(下称“生数科技”)发生工商变更,新增北京市人工智能产业投资基金为股东,同时注册资本由约147万人民币增至约153万人民币。

对此,《科创板日报》记者询问生数科技,公司回复称,北京市人工智能产业投资基金是天使+轮融资的新增股东,现在只是工商变更。

对标Sora

生数科技成立于2023年3月,法定代表人为唐家渝,由清华系 AI 公司瑞莱智慧RealAI、蚂蚁集团和百度发起的BV百度风投联合孵化创立,致力于打造可控多模态通用大模型。

股东信息显示,除上述资方外,该公司股东还包括智谱AI关联公司北京智谱华章科技有限公司。

据CEO唐家渝此前介绍,生数科技目前采取模型层和应用层两条路走路的模式。首先,构建覆盖文本、图像、视频、3D 模型等多模态能力的底层通用大模型,面向B端提供模型服务能力;其次,面向图像生成、视频生成等场景打造垂类应用,按照订阅等形式收费,应用方向主要是游戏制作、影视后期等内容创作场景。

*4月27日,在中关村论坛上,生数科技联合清华大学正式发布据称是“中国首个长时长、高一致性、高动态性视频大模型Vidu”,《科创板日报》记者当时在现场了解到,不少人认为该大模型很接近 Sora。**

据称,该模型支持一键生成长达16秒、分辨率高达1080P的高清视频内容。与Sora相似,Vidu所生成的短片,采用的是“一步到位”的生成方式,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间插帧和其他多步骤处理。

对于Vidu和Sora的对比,生数科技也在现场做了展示,比如,Sora在视频生成过程中丢掉了“旋转”这一关键词,但Vidu则能较好地抓住该内容,并实现视频视角的丝滑“旋转”。

一位业内人士告诉《科创板日报》记者,目前,国产文生视频模型的生成时长的瓶颈大概为4秒左右,国内大多厂商也在为突破该时限努力,而Vidu 已经将生成时长天花板拉长到了16 秒。

《科创板日报》记者了解到,目前国内外一次性视频生成能够达到或者超越Vidu级别的 ,主要有 OpenAI 的 Sora(60 秒)、Runway 的 Gen-2(18 秒)、前京东副总裁梅涛成立的 Hidream(15 秒以上)。

据《科创板日报》记者不完全统计,国内视频生成模型领域目前的主要玩家包括智谱AI、前字节跳动 AI Lab 总监王长虎创办的爱诗科技、Hidream以及字节跳动等。

其中,智谱AI此前研发了基于大模型的文生图和文生视频应用CogVideo,智谱AI方告诉《科创板日报》记者,CogVideo采用了多帧率分层训练策略生成高质量的视频片段,并将这些视频片段逐层插值得到最终的视频片段。

清华师生创业

财联社创投通数据显示,生数科技至今已经进行三轮融资,去年6月、8月,生数科技连续完成天使、天使+两轮融资,投资方包括蚂蚁集团、BV百度风投、卓源资本、锦秋基金,首轮融资后估值高达1亿美元。

而此次工商变更披露的北京市人工智能产业投资基金,则不在公司当时官宣的投资方之列。

今年3月,公司又宣布完成A轮融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。

**据《科创板日报》记者统计,本次北京市人工智能产业投资基金入资生数科技,是继今年投资智谱AI、面壁智能、瑞莱智慧、深势科技以来的第五次出手,这五家企业均位于北京,代表北京市国资基金对关键技术企业的大力支持。

《科创板日报》记者注意到,除了深势科技外,北京市人工智能产业投资基金出手的四家企业,均为清华系背景。**

据了解,生数科技核心研究团队,主要来自清华大学人工智能研究院。其首席科学家朱军,现任清华大学计算机系教授,同时也是清华人工智能研究院副院长、清华智能技术与系统国家重点实验室主任、智源首席科学家。

生数科技CEO唐家渝曾任腾讯优图实验室高级产品经理和瑞莱智慧RealAI副总裁,先后负责瑞莱智慧产品团队、AI安全产研团队及业务。

值得一提的是,在国内“科技成果转化”“教授创业”的热潮下,朱军也以首席科学家的身份,在创投圈开辟了一片新天地。

2018年7月,源自于清华大学人工智能研究院的瑞莱智慧创立,并成为清华大学推进人工智能技术与产业深度融合的产学研示范企业,由毕业于清华大学的田天博士担任公司CEO,清华大学AI研究院首任院长张钹院士与朱军共同担任公司首席科学家。