第二届中国国际供应链促进博览会11月26日在北京正式开幕。链博会吉祥物“链氪”来到数字科技展区,遇到了一位神秘人物↓↓↓
总台央视记者 张道峰:数字诗人李白是由人工智能大模型生成的,也就是我们常说的生成式人工智能,而做出这一大模型的是一家成立还不到一年的人工智能创新中心。
廉士国是创新中心首席人工智能科学家,他给我们现场拆解了人工智能大模型的运作过程。
生成一个数字诗人李白要分三步:先由文字生成图片,图片生成视频,文字再生成语音跟视频进行融合。不过,看似简单的三步,做起来却不容易。
中国联通人工智能创新中心首席AI科学家兼技术总师 廉士国:首先要训练一个语言模型,它大概需要40TB的数据,这个数据量大概相当于400万本电子书的数据量。
有了语言模型的基础,才能继续训练文生图、文生视频等多模态大模型,背后还需要大量“数据对”,也就是数据之间的联系,比如文字和图片对应的数据,图片和视频对应的数据等。
中国联通人工智能创新中心首席AI科学家兼技术总师 廉士国:大概需要10亿对文字图像对,从图像再到视频,大概在百亿对的级别。
不过,有了海量数据才是第一关,然后是“数据标注”,就是要把数据转化为机器学习算法能理解的形式。
总台央视记者 张道峰:想什么就能设计出什么,看似简单的过程,背后其实是一条全新而庞大的人工智能产业链在支撑。数字诗人李白能够作诗,算法、数据等等这条链的每一个环节都在发挥作用。
算法、数据、算力的高效协同,构成了生成式人工智能快速发展的重要链条。现在,大模型技术赋能千行百业,像“李白作诗”这样的“文物活化”技术正在走进我们的生活。
(总台央视记者 王琰 朱继华 朱虹 张道峰 邵晨)
(松花江网编辑 杨世阳 初审 张勇军 复审 李明丹 终审 王久权)
原标题: “链氪”探链丨数字诗人李白是怎么诞生的?
反侵权公告:
根据《中华人民共和国著作权法》、《信息网络传播权保护条例》等法律法规,未经书面许可,擅自转载本报社作品的,将涉嫌侵犯著作权人合法权益。为规范网络转载行为,制止非法侵权转载,本报社郑重公告:
一、任何单位或个人,在任何公开传播平台上使用著作权归属于江城日报社(包括《江城日报》、《江城晚报》、松花江网、吉林乌拉圈等)的原创内容,必须事先取得江城日报社书面授权;
二、对侵犯江城日报社(包括《江城日报》、《江城晚报》、松花江网、吉林乌拉圈等)著作权益的违法行为,本报社将采取一切合法措施,追究行为人的侵权责任,包括但不限于公开谴责、向国家版权行政管理部门举报、提起诉讼等;
三、对于各类非法转载行为,欢迎读者提供侵权线索:
程律师(法律顾问)0432-62223777