GPT-4omini背后团队揭秘:9人团华人面孔过半,清华北大同济校友在

2024-07-19 15:13 来源:投资界   阅读量:8853   

“大模型尺寸之争正在加速……倒退!”

OpenAI的GPT-4o mini一登场,又登上了大模型话题榜榜首。

并且这次话题焦点,是OpenAI不仅再树新标杆,还一出手就把性价比卷爆了——直接把此前大受开发者好评的Gemini 1.5 Flash和Claude 3 Haiku给碾压了。

这不,大神Karpathy火速发了篇小作文,做出开头提到的这么一句判断,并进一步解释:

我敢打赌,我们会看到能够可靠“思考”的“小”模型,它们的参数量甚至可能只有GPT-2那么大。

总之,开发者们的心情be like:

两年内大模型成本直降99%,今天宜当开发者。

锣鼓喧天的热烈讨论中,GPT-4o mini背后团队也没藏着掖着,都在????上卖力宣传了起来,并不吝对自家“杀手级团队”的自豪。

也再度引来外界对OpenAI人才的关注。

我们扒了扒,发现其中依然不乏华人面孔。

半数Leader是华人

OpenAI照例在博客末尾附上了团队负责人名单。

此番9位负责人中,有5位都是华人面孔。

Kevin Lu,自述最近刚加入OpenAI。2021年毕业于加州大学伯克利分校,就读期间受伯克利人工智能研究所联合主任Pieter Abbeel和谷歌DeepMind研究科学家Igor Mordatch指导,研究方向是强化学习和序列建模。

Shengjia Zhao,OpenAI研究科学家,方向为ChatGPT的训练和对齐。他于2022年加入OpenAI,博士毕业于斯坦福大学计算机科学系,本科毕业于清华大学。

任泓宇,去年加入OpenAI担任研究科学家,主要负责语言模型训练。他也是GPT-4o的核心开发者、GPT-Next项目组成员。

任泓宇本科毕业于北京大学,博士毕业于斯坦福大学。加入OpenAI之前,他在Apple、Google、NVIDIA 和Microsoft均有大量研究实习经历。

Haitang Hu,去年9月加入OpenAI。他在2011年本科毕业于同济大学计算机专业,后赴约翰·霍普金斯大学攻读计算机硕士。

加入OpenAI前,他在Google工作了7年多。参与过TensorFlow以及大语言模型基础设施的研发工作。

项目经理Mianna Chen,也是GPT-4o的项目经理。她于2023年12月加入OpenAI,之前在Google和DeepMind担任产品经理。她毕业于普林斯顿大学,也是沃顿商学院的MBA。

除了以上几位华人面孔,GPT-4o mini团队还有其他几位核心成员。

Jacob Menick,2022年9月加入OpenAI担任研究员,是GPT-4o mini的技术总负责人。

他还曾共同参与领导了GPT-4o预训练工作,以及ChatGPT 浏览功能和机器学习工具使用的开发,在 2023 年 4 月和 5 月期间负责旗舰模型的后训练工作。

在加入OpenAI前,他在DeepMind干了6年多,参与了Gopher、RETRO和Flamingo等主要语言模型项目,并为DeepMind多模态大模型铺平了道路。

Eric Wallace,去年11月加入OpenAI担任研究员,致力于大模型更可靠、安全和强大。

目前他还在加州大学伯克利分校读博,研究方向是增强机器学习的安全性/隐私性/鲁棒性。在加入OpenAI之前,他还在DeepMind和Meta实习过。

Nick Stathas,去年5月加入OpenAI,拥有高性能计算、机器学习、自动驾驶车辆和嵌入式系统等领域的经验。他本硕均就读于麻省理工学院,曾在MIT Driverless兼职首席工程师,负责无人驾驶汽车的自动驾驶软件开发。

Felipe Petroski Such,GPT-4o mini团队中最早加入OpenAI的人,也是GPT-4o的核心贡献者。

在加入OpenAI之前,他还在Uber担任了3年多研究科学家。再往前,他就读于罗切斯特理工学院,获得了计算机工程双学位,并在担任研究助理期间,专注于深度学习研究,包括文档分类、分割和智能字符识别。

mini速度到底有多快

说完了背后的人,回到GPT-4o mini本身,总结一下这波就是主打一个又快又便宜,要在开发者面前找回场子。

那么除了数据之外,最后,我们也不妨来实测一波它到底能有多快。

先直观感受一波速度:

还有网友把GPT-4o mini和另一位当红炸子鸡Claude 3.5 Sonnet放在Cursor上,来了场1v1。

另外,在面对长文本生成需求时,GPT-4o mini的16k输出长度确实比Claude 3.5 Sonnet的8k输出长度更好用。

比如做这道800字的高考作文题,相比于GPT-4o mini的库库输出,Claude同学“总之”刚写了半句就停下了,最后也没写完这篇作文。

正如网友所说,1.09元人民币/百万输入tokens、4.36元人民币/百万输出token的价格,基本上就是Claude 3 Haiku价格的一半,GPT-4o mini能有这表现,还要啥自行车。

毕竟,这可能一下子就让某些产品告别亏钱走向盈利了。

不过,也有人不买账:

一旦Gemini 2 Flash或者Claude 3.5 Haiku发布,GPT-4o mini就没看头了。

还有网友干脆阴阳怪气了起来:

还是那个问题:GPT-5呢?

参考链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

热门

一键全自动换电——泰州市首家蔚来第三代换电站在兴化戴南上线
一键全自动换电——泰州市首家蔚来第三代换电站

一辆新能源汽车稳稳地停到蔚来充换电一体站的停车平台上,汽车下部的换电装置自动开启,卸下用完电的电池,换上充足电的...更多>

喜报!中诚信托荣获深交所优秀债券投资交易机构奖项
喜报!中诚信托荣获深交所优秀债券投资交易机构

2月27日,深圳证券交易所组织召开2022年度债券监管发展业务座谈会,并表彰在服务国家重点战略、推进债券市场高质...更多>

人民银行:指导银行将个人信贷延期还款政策落到实处
人民银行:指导银行将个人信贷延期还款政策落到

2022年第一季度金融统计数据新闻发布会现场。人民网黄盛摄人民网北京4月14日电(黄盛)今日,中国人民银行(以下...更多>

发放消费券、举办消费节、推动线上线下消费融合,近期一批促消费措施密集推出—— 为消费升温积聚合力
发放消费券、举办消费节、推动线上线下消费融合

4月20日是海南离岛免税政策落地实施11周年。11年来,海南离岛免税销售金额和购物人数不断攀升,离岛免税购物已成...更多>

线上线下加速融合,新型业态惠民便民—— 商业新模式激发消费新活力
线上线下加速融合,新型业态惠民便民—— 商业

在上海街头,一家集合了艺术展览、画材、图书、生活家居、艺术衍生品、服装零售等多种业态内容的超级百货集合体验店,吸...更多>

聚焦

京东方A:第一季度净利润43.89亿元同比下滑16.57%
深蓝G318将于6月13日上市,你希望它卖什
“此生必驾318”我相信是每一个自驾游爱好者的心声,相比起飞...更多>
综合续航可达1458KM,岚图FREE318
岚图FREE318是岚图汽车推出的一款中大型增程式SUV,此...更多>
有望搭载华为乾崑/定位轿跑SUV,或30万起
日前,鸿蒙智行首款轿跑SUV——智界R7的官图正式发布。余承...更多>
想分理想L8的“蛋糕”,魏牌、奕派、零跑哪家
魏牌蓝山智驾版 魏牌选择更新蓝山车系,前不久带来了新款的蓝...更多>
广州金控期货有限公司上海分公司开业仪式暨股指
6月26日,广州金控集团旗下广金期货有限公司(简称广金期货或...更多>
都市穿越遇见阿勒泰,AIONY让旅行更精彩
在最近热门的电视剧《我的阿勒泰》中,一幅幅生动展现新疆阿勒泰...更多>
没买车的朋友还可以再等等,汽车市场价格体系已
如今整个汽车市场真的是乱成一锅粥,当然了这个混乱的局面带来的...更多>
两款车的风阻系数在SUV中都是相对很低的
智己LS6和小鹏G6都有着比较低趴圆润的车身线条,两款车的风...更多>
同为运动型中型车,凯迪拉克CT5对比奥迪A4
就像我们标题提出的一样,都花相同的预算去提回一台豪华B级车,...更多>
若羽臣003010.SZ:目前暂不涉及与苹果
格隆汇7月18日丨若羽臣在投资者互动平台表示,公司目前暂不涉...更多>