中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”_亚太时报网

(相关资料图)

新华财经北京8月14日电据上海市经信委消息，8月14日，上海人工智能实验室宣布，联合中国大模型语料数据联盟成员单位，共同开源发布“书生·万卷”1.0多模态预训练语料。

“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分，本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本，2200万个图文交错文档，1000个节目影像视频，具备多元融合、精细处理、价值对齐、易用高效等四大特征。

中国大模型语料数据联盟是由上海人工智能实验室联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团、上海数据集团、上海市数商协会、金杜律师事务所等单位联合发起成立的开放组织。

编辑：罗浩

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。

推荐内容

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

2023-08-14
保荐人突然“撤单” 万向系第5家上市公司IPO“梦碎”

2023-08-14
特斯拉：已在中国建立数据中心所有中国大陆市场车辆数据存储在境内

2023-08-14
搭载最新AI影像技术美图云修Pro版预计8月中旬上线

2023-08-14
【环球财经】新加坡股市14日重挫1.41%

2023-08-14
宁德时代又要放大招？快充电池或为本次新品发布主角

2023-08-14
数字经济+人工智能山东青岛这样解锁企业发展新优势→

2023-08-14
积极信号！龙湖出手

2023-08-14
超图软件：上半年归母净利同比增长206.73%

2023-08-14
大中矿业回应竞得川西天价锂矿：42亿一次缴清能实现

2023-08-14
百亿级私募梯队明显缩水 7月私募发行数量创今年以来新低

2023-08-14
当涂创业创新中心项目1#办公楼外墙施工完成

2023-08-14
紫罗兰玉石手珠百科

2023-08-14
52度国窖1573提价至980元/瓶？泸州老窖：正在核实

2023-08-14
贾跃亭亲手交付FF首辆FF 91 2.0 Futurist Alliance予首位塔尖用户

2023-08-14
中国移动上半年营收净利润同比增速垫底三大运营商实现全年营收破万亿或有压力

2023-08-14
A股收盘 | 沪指探底回升跌0.34% 数据要素等板块午后爆发

2023-08-14
最高人民检察院依法对郝宏军决定逮捕

2023-08-14
科创板收盘播报：科创50指数跌0.88% 软件股及IT股普涨

2023-08-14
收评：沪指探底回升跌0.34% 数据确权概念股大涨

2023-08-14
中国科学院官方解读韩国室温超导“LK-99”最新进展复现暂无结论研究有意义

2023-08-14
苏州太湖科学城功能片区以科创实力激发产业活力

2023-08-14
中国华融深圳分公司联合阿里资产成功举办2023年优质资产推介会

2023-08-14
电影《消失的她》密钥再次延期至9月21日，累计已取得35.19亿票房

2023-08-14
SE4：6.1寸OLED单摄

2023-08-14
深汕比亚迪汽车工业园二期预计9月份投产

2023-08-14
越跌越买股票私募逆向加仓百亿私募加仓意愿最强

2023-08-14
百亿A股突发！银行账户被冻结累计冻结金额超过1亿元

2023-08-14
惠誉：二季度钢材和铝材行业表现优于水泥 9月水泥业或加快复苏

2023-08-14
福彩3D第2023216期曾老师和值跨度字谜

2023-08-14
直击中融信托总部：未见大规模投资者聚集现场有警方维持秩序

2023-08-14
“卷”中存机遇新能源业内人士乐观预测下半年走势

2023-08-14
演员证怎么办理怎么办理演员工作证

2023-08-14
秋天的第一站，快来崆峒山“充电”吧！

2023-08-14
午评：两市低开低走沪指跌逾1% 地产与汽车行业跌幅靠前

2023-08-14
欧盟天然气价格飙升专家称制裁俄罗斯令欧盟遭反噬

2023-08-14
深圳市龙岗区卫哥厨具商行无熄火保护装置、不符合强制性标准的燃气灶案

2023-08-14
特斯拉再掀价格战，Model Y两款豪华车型下调1.4万元人民币

2023-08-14
锂价接连下探未导致交易冷清碳酸锂价格近期有望企稳反弹

2023-08-14
香港知名女星正式宣布分手，否认有第三者介入，冻卵20粒渴望结婚

2023-08-14
美国经济危机的根本原因（美国经济危机）

2023-08-14
雅本化学（300261）8月11日主力资金净买入724.82万元

2023-08-14
内蒙古赤峰市全面启动两大沙地歼灭战

2023-08-14
医药反腐下 12支医药股一周逆势涨超20% 多家公司发布风险提示

2023-08-14
三年7个亿长春高新重金砸向会议费

2023-08-14
供应端维持增量需求端持续弱势锂盐产业链多环节产品价格下跌

2023-08-14
中信证券：预计2025年我国核电产业新开工项目投资规模为2310亿元

2023-08-14
开学季临近文化纸价格触底反弹行业走向盈利有望实现

2023-08-14
河道还有“盲肠段”？上海这些水体反复黑臭居民难忍，如何才能根治？

2023-08-14
多家巨头出手四川“天价锂矿”争夺战落幕

2023-08-14