MosaicML发布大型语言模型 MPT-7B 可商用

来源: 站长之家时间：2023-05-11 12:10:03

(资料图片)

站长之家（ChinaZ.com）5月11日消息:MosaicML 的 MPT-7B 是一个具有近70亿个参数的大型语言模型，该团队在自己的近万亿个标记的数据集上对其进行了训练。

MosaicML 遵循 Meta 的LLaMA模型的训练方案。培训花费近200，000美元，使用 MosaicML 平台耗时9.5天。

MosaicML表示，MPT-7B 与 Meta 的70亿参数 LLaMA 模型的性能相匹配，使其成为第一个达到该水平的开源模型，领先于OpenLLaMA。与 Meta 的模型不同，MPT-7B 已获得商业使用许可。

除了“MPT-7B Base”模型，MosaicML 还发布了三个变体:MPT-7B-StoryWriter-65k+、MPT-7B-Instruct 和 MPT-7B-Chat。

借助 MPT-7B-StoryWriter-65k+，MosaicML 还发布了一个模型，该模型能够读取和写入上下文长度非常长的故事。为此，使用 books3数据集的子集对 MPT-7B 进行了微调，上下文长度为65，000个标记。OpenAI 最大的 GPT-4变体能够处理32，000个标记。

根据 MosiacML 的说法，该模型可以通过一些优化扩展到超过65，000个token，并且该团队已经在使用 Nvidia A100-80GB GPU 的单个节点上展示了多达84，000个token。但即使有65，000个token，也可以阅读整部小说并写一篇结语。

项目网址：https://github.com/mosaicml/llm-foundry

（举报）

标签：

上一篇：首都护理工作取得明显成效，二级及以上医院实现优质护理全覆盖全球新视野

下一篇：最后一页

精彩推送

MosaicML发布大型语言模型 MPT-7B 可商用

MosaicML+的+MPT-7B+是一个具有近70亿个参数的大型语言模型，该团队在自己的近万亿个标记的数据集上对其进

来源：站长之家时间：2023-05-11 12:10:03
首都护理工作取得明显成效，二级及以上医院实现优质护理全覆盖全球新视野
新闻报道怎么写范文_新闻怎么写范文

1、如何写新闻。2、新闻是新近发生、发现的具有一定意义的事实的报道。3、新闻采写涉及到两条最基本的原则

来源：互联网时间：2023-05-11 11:19:20
三川智慧：5月10日融资买入596.28万元，融资融券余额2.79亿元
泰安1日游（泰安一日游最佳路线）

1、最经典的红门路徒步中线，其实是中线登封御道：岱庙—红门—岱顶这条古老的传统线路。2、泰山与泰安...

来源：互联网时间：2023-05-11 10:38:41
环球信息:有味的三国史关羽为啥失败
热门看点：官方售价336.60万元宝马8系限量收藏款上市

近日，宝马8系JEFF KOONS限量收藏款宣布正式上市，官方售价336 60万元。该车基于宝马8系四门轿跑车打造，是

来源：搜狐科技时间：2023-05-11 10:02:13
当前聚焦：招嫖、耳骚，斗鱼的女主播有多野？
感谢朋友为自己过生日怎么发朋友圈_自己过生日怎么发朋友圈

1、自己过生日朋友圈说说：再不努力，明年的今天还是我的生日。2、2、承蒙时光不弃，我又长一岁，祝自己生

来源：互联网时间：2023-05-11 08:57:56
国脉文化（600640）5月10日主力资金净买入2335.04万元
焦点热门:早安甘孜！新闻来了【2023.5.11】

朝闻甘孜尽在微报⇩天气播报▶甘孜州气象台发布天气趋势预报：11日白天，州北部、东部地区阴有小到中雨（雨

来源：甘孜日报康巴传媒时间：2023-05-11 07:39:15
天天百事通！白送价！4T硬盘仅288元
天天报道:天舟六号货运飞船发射任务取得圆满成功空间站应用与发展阶段飞行任务首战告捷

据中国载人航天工程办公室消息，北京时间2023年5月10日21时22分，搭载天舟六号货运飞船的长征七号遥七运载

来源：央视新闻客户端时间：2023-05-11 05:35:52
世界观点：传闻：欧盟监管机构或于下周批准微软对动视的收购
Woj：自雷迪克退役后凯尔特人等多支球队一直都想让他当助教

直播吧5月11日讯据名记Woj报道，消息源透露，15年NBA老将兼ESPN分析师JJ-雷迪克已经接受了多伦多猛龙队教练

来源：直播吧时间：2023-05-11 01:46:22
山东临沂3家饭店违反反食品浪费法被处罚-今日热门
美股三大指数上涨纳指涨幅达到1%

美国4月CPI低于预期，美股三大指数集体上涨，截至发稿，道指涨0 12%，纳指涨1 09%，标普500指数涨0 58%。个

来源：东方财富Choice数据时间：2023-05-10 22:13:56
每日短讯：发糕蒸多久就熟了(做发糕有哪些小窍门-面粉做的发糕要蒸多少分钟)
全球新消息丨iPhone 15 Pro Max潜望式6倍变焦

这段时间以来，外界越来越将目光集中到新一代的iPhone15系列上，截至目前已经有关于该机外观和配置非常多的

来源：TechWeb 时间：2023-05-10 20:54:21
锦鲤娜美炫彩_锦鲤娜美|环球微动态
南国置业：未来三年主业转为商业运营服务、城市综合运营|焦点信息

“1个主业”——以运营服务为主业，深耕产业运营赛道，打造具有公司特色的运营服务，向综合运营服务类业...

来源：观点地产网时间：2023-05-10 19:06:27
鱼缸爆藻最快的方法有吗(小球藻在鱼缸下会快速繁殖吗)-今日精选
严监管持续川宝投资被责令改正世界热头条

上证报中国证券网讯近日，中国证监会北京监管局在官网发布对北京川宝投资管理有限公司（以下简称川宝投资）

来源：时间：2023-05-10 17:58:30
今年我省新打造20条敬老城市公交线路
国网三明供电：落实从严治党全域打造“清风站所”|全球报道

“这里是供电所人员的‘小微权力’清单和负面清单，用这种直观的方式，希望能给大家起到立体教育、全方...

来源：中国能源网时间：2023-05-10 17:04:43
外交部：望阿临时政府以切实努力争取国际社会信任
当前头条：大主宰之洛璃失身大主宰洛璃h虐文

今天来聊聊关于大主宰之洛璃失身，大主宰洛璃h虐文的文章，现在就为大家来简单介绍下大主宰之洛璃失身，大

来源：城市网时间：2023-05-10 16:06:40
天奇股份：公司预计2023年下半年磷酸铁锂产线将达到设计产能的80%左右
常德武陵：人间烟火气，“警”色别样新_今日最新

红网时刻新闻记者黄刚通讯员盛斌刘定鹏常德报道绚烂的霓虹，奔涌的人潮，酒杯的交响，香辣的烟火气息。夜色

来源：红网时间：2023-05-10 15:08:07
邀请函 | CHINA P&E艺卓邀您莅临体验旗舰新品|焦点讯息
快资讯丨去眼袋黑眼圈眼部皱纹用什么方法最佳

崔琳静副主任医师淮北市人民医院病情分析：去除眼袋黑眼圈眼部皱纹用手术的方法会最佳一些，因为像做手

来源：手机网易网时间：2023-05-10 14:19:41
5月10日 13:22分嘉元科技（688388）股价快速拉升
男警飞身夺刀，女警暖心开导，刚柔并济救下轻生女|环球热门

近日，南京六合区金牛湖街道辖区一女孩手持刀片站在河边欲轻生，手腕有多处划伤，血流不止，金胜利见准时机

来源：扬眼时间：2023-05-10 13:04:30
快讯2023-05-10 11:21:25|全球今日讯
全球热门:农业银行聚焦实体经济重点领域强化金融资源供给

农业银行坚守服务实体经济主责主业，把服务稳经济和扩内需放在突出位置，不断优化完善制造业、科技创新、绿

来源：中国新闻网时间：2023-05-10 12:07:44
世界新消息丨外贸稳中向好势头进一步延续（新数据新看点）
最新：唐人神：拟开展不超5亿元玉米豆粕等商品期货套期保值业务

唐人神12月4日公告，公司拟进行玉米、豆粕等商品期货的套期保值业务，2023年1月1日起至2023年12月31日，公司开

来源：互联网时间：2023-05-10 10:53:45
美国债务上限逼近“摊牌”时刻，首回合谈判毫无进展？
美国环保局被要求监管饮用水中火箭燃料化学物质全球看热讯

当地时间5月9日，美国一家联邦法院驳回了环境保护局关于不对饮用水中一种用于火箭燃料的化学物质进行监管的

来源：央视新闻客户端时间：2023-05-10 10:18:00
动力强劲!天合光能助力国能长源200MW"光伏海"并网发电!
世界观热点：如何制作腰带担架

您可以使用表格在裙子、裤子和短裤上拉伸弹性腰带。自制腰带担架是裁剪衣服的一种经济高效的替代方法，可以

来源：太平洋礼物网时间：2023-05-10 09:22:30
townhouse音标_townhouse
残花是李清照写的吗_残花李清照|每日信息

1、《残花令抄》李清照盼不到花开花落花满天留不住春来春往春景残一杯苦酒三更酿几分娇颜淡梳妆盼盼盼等不

来源：互联网时间：2023-05-10 08:46:04
年报“非常规”盈利，近50家公司收到问询函
职业本科成培育高技能人才新赛道-即时看

随着现代职业教育体系的建立，我国应用型人才培养体系已初步形成，这为优秀专科毕业生进一步深造提供了更为

来源：工人日报时间：2023-05-10 07:53:28
汉钟精机获149家机构调研：在冷冻冷藏领域公司压缩机应用更加广泛，可应用于农产品保鲜、渔船速冻、食品速冻隧道等行业（附调研问答）速看料
it技术学习网站_it技术是什么-天天新要闻

1、信息技术InformationTechnology信息技术（InformationTechnology，简称IT

来源：互联网时间：2023-05-10 05:46:21
下周将公布网上发行中签率的新股简析（5月15日~5月19日）
EOCRIFM420智能保护器规格功能介绍-世界今日讯

EOCRIFM420-WRDUHZ是EOCRIFM420产品下一款上下直通式穿线方式，工作电源电压100～240VAC DC规格。根据不同

来源：上海韩施电气he 时间：2023-05-10 02:11:22
环球新动态：掇读音_掇