跨元旦直播前夜,小米(01810)董事长雷军千万元年薪挖角DeepSeek“天才AI仙女”成为业内热门。
一财音书称,DeepSeek开源大模子DeepSeek-V2的要津开发者之一罗福莉将加入小米,或供职于小米AI本质室,带领小米大模子团队。
公开信息潜入,还在读研二时,罗福莉就在东说念主工智能规模顶级海外会议ACL上发表8篇论文(其中2篇一作),自后登上知乎热搜而飞快走红。罗福莉毕业后进到阿里达摩院,从事预磨练讲话模子,主导开发了多讲话预磨练模子VECO。2022年她加入幻方量化,从事深度学习相干策略建模和算法商议,后又加入幻方量化创立的DeepSeek担任深度学习商议员,参与研发大模子DeepSeek-V2。
据知情东说念主士称,雷军合计小米在大模子规模发力太晚,于是躬行挖东说念主,重金招募不祥领军小米大模子的东说念主才,支付的薪酬水平在千万元级别。
当下,AI大模子还是成为科技公司竞争的中枢,致使是慌乱方位。而马斯克创立的xAI则进一步放大了这种慌乱。
上周,xAI官宣完成60亿好意思元新融资。兼之2024年5月B轮的60亿好意思元,xAI公开的总融资额还是累计120亿好意思元。而这家AI公司2023年7月份才建立。更早一些时刻,另一家AI公司Anthropic从亚马逊(AMZN)赢得了 40 亿好意思元融资,总融资额达到 137 亿好意思元。而 OpenAI 在10月份最新融资66 亿好意思元,总融资额增至 179 亿好意思元。
AI大模子并非新认识,但具有关键影响力和代表性的大模子主要出当今 2018 年之后。2020 年,OpenAI 公司推出了 GPT-3,在零样本学习任务上终显着巨大性能擢升。2022 年 11 月,搭载了 GPT3.5 的 ChatGPT上市,凭借传神的天然讲话交互与多场景实质生成智力,飞快引爆互联网。2023 年 3 月,超大限制多模态预磨练大模子 GPT-4 发布,具备了多模态判辨与多类型实质生成智力。
对小米这么的公司来说,大模子智力将决定以前的竞争力。大模子和会俗期骗于小米的手机及汽车等业务,包括语音交互、智能家居抵制、生涯助手等场景。包括华为、荣耀、vivo和oppo等手机公司齐将大模子手脚紧要战术推出,比如华为的盘古大模子、vivo多模态大模子期间期骗 “vivo 看见 - 蓝心升级版”等。
然则大模子虽好,却是个极为烧钱的事情,需要建立限制雄伟的基础措施,为大模子提供实足的算力撑捏。xAI融资主如果为了快速推广基础措施,比如建立了配备价值数十亿好意思元、10万个英伟达GPU的超等算计机Colossus。而xAI接下来探究把这一限制扩大到一倍,也等于20万个GPU。
对小米来说,这种资金限制巨大的插足状貌很难跟进。据财报信息,小米瞻望 2024 年研发用度将达到 240 亿元,2025 年更将攀升至 300 亿元,从 2022 年到 2026 年的五年内,研发插足瞻望将向上 1000 亿元。
此前,小米在大模子方面奉行的是勾通与轻量化策略。与阿里云达成勾通,强化旗下东说念主工智能助手多模态 AI 生成智力;领受轻量化、腹地部署的大模子策略,在重心场景上捏续调优。
而近期大热的DeepSeek为雷军提供了一个更具性价比的大模子策略。DeepSeek被誉为“AI界拼多多”,性能上与顶尖模子相忘形,同期价钱却远低于市集平均水平。
尤其是近期刚发布的全新超大限制模子——DeepSeek-V3。测试效果潜入,DeepSeek-V3已卓绝诸如 Meta 的 Llama 3.1-405B、阿里 Qwen 等主流开源模子,致使在性能上濒临 Anthropic 和 OpenAI 等禁闭模子,大大收缩了开源和闭源 AI 之间的差距。
但按每 GPU 小时 2 好意思元的价钱算计,DeepSeek-V3 的合座磨练本钱约为 557.6 万好意思元。这一数字远低于常常磨练大型讲话模子所需的数亿好意思元。举例,Llama-3.1 的磨练本钱计算向上 5 亿好意思元。
这也意味着DeepSeek的基础措施本钱要远低于其他AI大模子。公开信息潜入,幻方量化投资 2 亿元自主研发深度学习磨练平台 “萤火一号”,并在 2021 年进一步插足 10 亿元用于 “萤火二号” 的研发,搭载了约 1 万张英伟达A100 显卡。在磨练 DeepSeek-v3 模子时,DeepSeek仅用 2048 个英伟达H800 芯片驱动 57 天,消费 278 万个 GPU 小时。
据Andrej Karpathy的分析,按照以往训导,这种智力级别的大模子,常常需要接近1.6万张GPU,目下行业内的模子大多使用约10万张GPU。举例,Llama 3 405B模子消费了3080万GPU小时。
从业务层面看,小米也许是国内最应该重金插足AI大模子的公司——小米可能领有国内最丰富的AI进口。抵制2024年Q3,小米AIoT平台一语气的IoT拓荒超8.61亿,同比增长23.2%。如果AI大模子不祥顺利融入如斯之多的IoT拓荒,小米不错进一步加固我方的竞争门槛。
在线影视不外目下对大模子需求最强的业务可能是智能驾驶。自从客岁以来,端到端大模子真的成为了国内智能驾驶的标配,并且也实在大幅度擢升了智能驾驶的水准。较晚入局造车的小米汽车天然取得了不俗的收货,但在智能驾驶方面相对保守,并且在智驾总里程方面也逾期于业内主流公司。公开数据潜入,小米SU7智驾里程已冲破1亿公里,理思智驾总里程达到22亿公里,华为智驾总里程向上7.36亿公里,小鹏汽车智驾总里程已向上 5.41 亿公里。
“天才AI仙女”不祥借助“AI界拼多多”模子匡助小米汽车自后居上么? AV解说