揭秘iPhone里的Transformer:基于GPT-2架构,分词器含

2023-09-19 11:38 来源:IT之家   阅读量:8940   

苹果 Transformer 的“秘密”,让发烧友给扒出来了。

大模型浪潮下,即使保守如苹果,也每逢发布会必提“Transformer”。

比如,在今年的 WWDC 上,苹果就已宣布,船新版本的 iOS 和 macOS 将内置 Transformer 语言模型,以提供带文本预测功能的输入法。

苹果官方没有透露更多信息,但技术爱好者们可坐不住了。

一位名叫 Jack Cook 的小哥,就把 macOS Sonoma beta 翻了个底朝天,结果,还真挖出不少新鲜信息:

  • 模型架构上,Cook 小哥认为苹果的语言模型更像是基于 GPT-2 打造的。

  • 在分词器方面,表情符号在其中十分突出。

更多细节,一起来看。

基于 GPT-2 架构

先来回顾一下苹果基于 Transformer 的语言模型能在 iPhone、MacBook 等设备上实现怎样的功能。

主要体现在输入法方面。语言模型加持下的苹果自带输入法,可以实现单词预测和纠错的功能。

Jack Cook 小哥具体测试了一下,发现这个功能主要实现的是针对单个单词的预测。

图源:Jack Cook 博客文章

模型有时也会预测即将出现的多个单词,但这仅限于句子语义十分明显的情况,比较类似于 Gmail 里的自动完成功能。

图源:Jack Cook 博客文章

那么这个模型具体被装在了哪里?一通深入挖掘之后,Cook 小哥确定:

我在 /System/ Library / LinguisticData / RequiredAssets_en.bundle/ AssetData / en.lm/ unilm.bundle 中找到了预测文本模型。

原因是:

1、unilm.bundle 中的许多文件在 macOS Ventura里并不存在,仅出现在了新版本 macOS Sonoma beta(14.0)里。

2、unilm.bundle 中存在一个 sp.dat 文件,这在 Ventura 和 Sonoma beta 里都能找到,但 Sonoma beta 的版本中更新了明显像是分词器的一组 token。

3、sp.dat 中 token 的数量跟 unilm.bundle 中的两个文件 ——unilm_joint_cpu.espresso.shape 和 unilm_joint_ane.espresso.shape 能匹配得上。这两个文件描述了 Espresso / CoreML 模型中各层的形状。

进而,小哥根据 unilm_joint_cpu 中描述的网络结构,推测苹果模型是基于 GPT-2 架构打造的:

主要包含 token embeddings、位置编码、解码器块和输出层,每个解码器块中都有类似 gpt2_transformer_layer_3d 这样的字眼。

图源:Jack Cook 博客文章

根据每层大小,小哥还推测,苹果模型约有 3400 万参数,隐藏层大小是 512。也就是说,它比 GPT-2 最小的版本还要小。

小哥认为,这主要是因为苹果想要一种不太耗电,但同时能够快速、频繁运行的模型。

而苹果官方在 WWDC 上的说法是,“每点击一个键,iPhone 就会运行模型一次”。

不过,这也就意味着,这个文本预测模型并不能很好地完整续写句子或段落。

图源:Jack Cook 博客文章

模型架构之外,Cook 小哥还挖出了分词器的相关信息。

他在 unilm.bundle/ sp.dat 里发现了一组数量为 15000 的 token,值得关注的是,其中包含 100 个 emoji。

Cook 揭秘库克

尽管此 Cook 非彼库克,小哥的博客文章一发出,还是吸引了不少关注。

基于他的发现,网友们热烈地讨论起苹果在用户体验和前沿技术应用之间的平衡大法。

回到 Jack Cook 本人,他本科和硕士毕业于 MIT 的计算机专业,目前还在攻读牛津大学的互联网社会科学硕士学位。

此前,他曾在英伟达实习,专注于 BERT 等语言模型的研究。他还是《纽约时报》的自然语言处理高级研发工程师。

那么,他的这一番揭秘是否也引发了你的一些思考?欢迎在评论区分享观点~

原文链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

热门

一键全自动换电——泰州市首家蔚来第三代换电站在兴化戴南上线
一键全自动换电——泰州市首家蔚来第三代换电站

一辆新能源汽车稳稳地停到蔚来充换电一体站的停车平台上,汽车下部的换电装置自动开启,卸下用完电的电池,换上充足电的...更多>

azg集团多维度赋能品牌,助力打造可持续产业生态
azg集团多维度赋能品牌,助力打造可持续产业

日前,由azg集团与Bubs贝儿联合举办的“Bubs贝儿纯净营养,守护新队友”五一特别场线下亲子活动圆满结束,门...更多>

喜报!中诚信托荣获深交所优秀债券投资交易机构奖项
喜报!中诚信托荣获深交所优秀债券投资交易机构

2月27日,深圳证券交易所组织召开2022年度债券监管发展业务座谈会,并表彰在服务国家重点战略、推进债券市场高质...更多>

银保监会就保险保障基金管理办法公开征求意见
银保监会就保险保障基金管理办法公开征求意见

为促进保险业稳健经营和高质量发展,更好发挥保险保障基金的积极作用,维护保单持有人合法权益,银保监会商有关部门对2...更多>

人民银行:指导银行将个人信贷延期还款政策落到实处
人民银行:指导银行将个人信贷延期还款政策落到

2022年第一季度金融统计数据新闻发布会现场。人民网黄盛摄人民网北京4月14日电(黄盛)今日,中国人民银行(以下...更多>

聚焦

发放消费券、举办消费节、推动线上线下消费融合,近期一批促消费措施密集推出—— 为消费升温积聚合力
实干中国沐光而行!产业振兴唱响古丈新茶歌
雨落古丈,雾气氤氲,青山如黛。 返乡;新农人向清标在酝酿一...更多>
啄木鸟家庭维修高铁广告专列首发 领跑家修业“
2023年9月12日,啄木鸟家庭维修高铁广告列车在上海虹桥站...更多>
集运指数欧线期货上市首月运行平稳
2023年8月18日,上海期货交易所上市集运指数期货。该品种...更多>
9月以来机构频繁调研光刻机概念股
近期,光刻机概念走红,一批牛股由此诞生,光刻机概念板块也吸引...更多>
轮胎企业齐发涨价函下游经销商能否买账?
9月份以来,多家轮胎企发布涨价函,截至9月18日,已有玲珑轮...更多>
人民日报金骆驼专访:中哈农业合作不断深化(共
哈萨克斯坦金骆驼奶粉加工厂内,员工正在工作。奥斯帕诺夫摄(新...更多>
汉中市举办网络安全技能大赛,市交通运输局代表
9月12日,汉中市首届“移动杯”党政机关网络安全技能大赛火热...更多>
杭州亚运会火炬传递来到金华 顾家家居顾海龙担
9月17日,杭州第19届亚运会火炬传递来到浙江金华站,共有1...更多>
壹大夫乳酸抑菌片:女性的秘密武器
在生活的各种压力下,现代女性往往忽视了一个重要的问题——私密...更多>
壹大夫HPV宫颈筛查包:安全、快捷、准确的筛
随着现代社会的发展,宫颈癌已经成为女性健康的一大杀手。根据中...更多>