查看原文
其他

黄仁勋自述坚持61年成就英伟达;神秘gpt2-chatbot模型引爆全网|钛媒体AGI

任颖文、林志佳 钛媒体AGI
2024-09-06

今天。通用人工智能(AGI)领域又公布了一系列重磅消息。

4月30日消息,近日,美国哥伦比亚广播公司(CBS)《60分钟》节目发布比尔·惠特克(Bill Whitaker)与英伟达CEO黄仁勋(Jensen Huang)的对话交流。

黄仁勋表示,他在15岁时,曾在美国连锁快餐店Denny’s餐厅做洗碗工,在这里萌生了创业年头,如今成长为美国科技巨头CEO。“没有什么特别的,只是61年中每一天的努力工作。想做出卓越的事情,应该都不容易。”

与此同时,今天凌晨,一款神秘的“gpt2-chatbot”模型引爆全网,宣称能力超越一众开源模型,被认为是GPT-5,几乎所有人都在谈论它,服务器都被挤爆了。

OpenAI CEO奥尔特曼(Sam Altman)看热闹不嫌事儿大,直接发帖表示:我确实对gpt2情有独钟。

国内 AI 领域也有重大消息。五一休假之前,月之暗面今早突然推出新功能Kimi+智能助手,用户可以通过Kimi+获取个性化的购物推荐,了解产品信息,并获取相关资讯。这一新功能有望提升用户的购物体验,使AI成为更加全面的生活助手。


黄仁勋:AI 取代不了人类,我坚持61年才成就英伟达


迄今为止,全球仅有4家公司市值超过了两万亿美元:微软、苹果、谷歌母公司Alphabet,以及GPU(图形处理器)芯片龙头英伟达。

实现市值从1万亿到2万亿美元这一里程碑式的跳跃,英伟达仅用了8个月时间,而另外三家科技巨头均耗费了至少两年。

黄仁勋近日接受《60分钟》节目专访时谈到,今年3月英伟达GTC大会演讲中,他其实非常紧张。

“我本质上是一名工程师,而不是演员。每当我走上台前,感受到那股狂热的氛围,我都几乎要喘不过气来。说实话,我可能是有史以来最胆小的一个人。每次上台,我都还是会感到害怕。有时候,我甚至希望这一切能快点结束!”黄仁勋说。

Blackwell的推出被视为未来新一轮工业革命的核心引擎。黄仁勋称,Blackwell每秒能进行千万亿次的计算,这是一个令人难以置信的数字。在这样强大的性能下,他希望Blackwell能做出一些超出期待的事情,这才是英伟达不断追求创新的真正意义所在。

黄仁勋还向CBS介绍英伟达的AI技术。“一旦它(GPU)学会了计算天气,其速度将比超级计算机快出3000倍,而能耗却能降低1000倍。”黄仁勋介绍道。

黄仁勋坦言:“在药物发现、材料设计等领域,AI正展现出巨大的潜力。我们需要AI来帮助我们探索那些我们无法独自涉足的宇宙角落。”

随着AI行业的发展,未来 AI 机器人大规模应用后是否会抢走人类的工作?对于这一问题,黄仁勋似乎并不担忧。

黄仁勋表示,有些工作中,人类仍然扮演着不可或缺的角色。

“人工智能会帮助企业更具生产力,收入会随之增加,我还从来没见过一家公司在收入增加时不雇用更多的人。人们还是会希望工作过程有人类的参与,因为人类有良好的判断能力,在某些特定状况下,机器人是无法理解的。”

在采访最后,黄仁勋回忆起创业之初的经历。

谁能想到,这样一家全球科技龙头企业的创立想法,竟萌生于圣何塞州的一家美国连锁快餐店Denny’s。巧合的是,黄仁勋在15岁时,就曾在一家Denny’s餐厅做洗碗工。

平淡的生活始终没有磨去黄仁勋对于技术理想追求的热情。1993年,已婚并有孩子的黄仁勋和他的两个朋友——英伟达联合创始人Chris Malachowsky和Curtis Priem,设想了一种处理视频游戏图形的全新方法。

“当时我们就坐在餐厅的那个位置,三人商量后决定创办这家公司。但坦白来说,当时我不清楚该怎么做”,黄仁勋说。

不出意外,创业并非一帆风顺,最初的尝试甚至让公司在1996年就陷入了破产危机。好在两位合伙人和一众天才工程师后来找到了正确的方式,从视频游戏中汲取了灵感,并研发制造出突破性的GPU,让整个行业开始了变革。

成立8年后,英伟达被纳入标普500指数。但黄仁勋的野心不止于此,他致力于开发革命性的、由GPU驱动的超级计算机的软硬件,使芯片能力远远超出视频游戏领域。在当时的华尔街,对于早期开发者来说,这是一个冒险的赌注,也是一个启示。

现在的英伟达就是大家看到的那样,非常成功。当记者提问到,这一切的成功该归因于运气还是远见时,黄仁勋说,“是基于远见的运气。”

“我们在当时发明了技术(软硬件技术),而该技术在后来工程师们研究机器深度学习时,发现并证明非常适合人工智能的研发。”

从洗碗工到科技巨头CEO,黄仁勋最后总结表示,“没有什么特别的,只是61年中每一天的努力工作。想做出卓越的事情,应该都不容易。如果你想要实现非凡的成就,就不能轻易妥协。这条路并不容易。”


神秘gpt2-chatbot模型曝光、能力太强被疑GPT-4.5,引爆全网


4月30日,今晨在大模型基准对比网站( http://chat.lmsys.org)上,一种神秘、全新 AI 模型"gpt2-chatbot"突然出现,能力很强,但是他自我描述为GPT-4,引起广泛关注。

网友们猜测,它是否是OpenAI即将发布的GPT-4.5,或者是一种全新的AI系统。

初步体验显示,gpt2-chatbot的能力水平大约在GPT-4左右,语音输出与GPT-4有些类似但又略有不同。从一些截图来看,它在规划和列出待办事项方面似乎比GPT-4做得更好,会主动列出潜在的网站和搜索查询词。不过,也有人认为这种增强只是通过针对性微调GPT-4就能实现。

有人声称,已获取了gpt2-chatbot的系统提示词,但消息真实性仍有待验证。

此外,一些用户发现,gpt2-chatbot在某些特殊标记方面与其他OpenAI模型存在相同弱点,并且似乎使用了与OpenAI其他模型相同的词汇切分方式,从中推测它可能出自OpenAI之手。而更令人振奋的是,这个模型展现出突破长期遵循的约束条件的能力。

有人猜测,gpt2-chatbot可能是OpenAI的开源模型的一个预览版本,是四年前的gpt-2微调版本,不过也有人认为这是下一个版本的GPT模型,或是公开测试版的GPT-4.5或GPT-5,目前看来较为可能的猜测是,它其实是经过大规模数据集训练的OpenAI 2019年GPT-2模型。

有网友组织了更详细的测试,有如下发现:

  • 它使用OpenAI的tokenizer,对OpenAI使用的特殊token有反应,且对Claude/Llama/Gemini使用的特殊token没有影响。

  • 当咨询紧急情况/法律相关问题时,它会给出OpenAI的联系方式。

  • 针对OpenAI模型的提示词注入攻击有效,且它从未声称自己来自OpenAI之外的组织。

基于以上种种信息,不少人猜测它就是匿名发布的GPT-4.5,或GPT-4原始版本经过不同的对齐训练。

就在上午,奥尔特曼发推文确认,这是一个名为GPT2的一个模型:我确实对 GPT2 情有独钟,但他没有明确说明这个模型与OpenAI的关系,以及是否为下一代模型产品。

这样一下子,是OpenAI匿名发布新模型炒作的可能性更大了一些。

试玩地址:https://chat.lmsys.org/;https://rentry.org/gpt2


Kimi上新,Plus让智能助手增强生产力属性


今早,月之暗面突然推出新功能Kimi+智能助手,引发关注。

具体来说,用户可以通过Kimi网页版打开就能使用kimi+功能,平台将Kimi+集成在了左侧边栏,原会话模式、个人设置不变,新增回到首页、Kimi+、我的智能体等icon(图标)。

Kimi+,也就是智能体(AI Agent)。在红杉AI Ascent 2024活动上,吴恩达博士提出“基于GPT-3.5构建的智能体工作流在应用中要比GPT-4好”的重要观点,可见智能体的重要性。

简单来说,Kimi+就是Kimi在各个平行宇宙的分身,在各个领域都拥有Kimi的本领,帮你“打怪升职”。

而用户使用Kimi+,可获取个性化的购物推荐,了解产品信息,并获取相关资讯。这一新功能有望提升用户的购物体验,使AI成为更加全面的生活助手。

截至发稿前,Kimi+首批上新了23个智能体,分别是官方推荐、办公提效、辅助写作、社交娱乐、生活实用4个领域。

当前,Kimi+只支持网页版,APP和小程序暂不支持。即使在APP和小程序上,通过历史会话继续提问,也无法召唤出Kimi+。看来想要APP和小程序体验Kimi+,还得要等待版本更新。

试用体验:https://kimi.moonshot.cn/kimiplus-square


Med-Gemini:基于Google Gemini的多模态医学大模型,可理解手术视频


今晨,Google发表了一篇论文详细介绍了其Med-Gemini多模态医学大模型。

该模型不仅具有多模态能力和长文本处理功能,还能够处理医学图像、手术视频、基因组学、超长健康记录、心电图(ECG)等多模态数据的对话。可以处理和分析手术视频,识别手术过程中的关键步骤和事件。Med-Gemini包含五个不同版本:Med-Gemini 1.0;Med-Gemini 1.5;Med-Gemini-M 1.0;Med-Gemini-L 1.0;Med-Gemini-S 1.0

论文显示,模型在10个测试中达到了新的SoTA性能。其中,在医疗问答、总结和文件起草等多种模式中都表现出色,超过了 GPT-4 模型的表现;而在模拟美国医学执照考试(USMLE)风格的问题解答中,Med-Gemini显示了91.1%的准确率,这是该任务的新高。同时,在包括新英格兰医学杂志(NEJM)的图像挑战在内的7个多模态基准测试中,Med-Gemini的平均性能超过了GPT-4V,平均相对提升了44.5%。


ChatGPT 记忆功能全量上线


今晨,OpenAI在X发帖宣布,“记忆”功能向ChatGPT Plus用户全面开放。


现在,ChatGPT能记住你和GPT互动的所有内容,能够将其学到的东西在聊天之间保留下来,使其能够提供更相关的响应。随着你与ChatGPT的互动,它将通过记住对话中的细节和偏好而变得更有帮助。而你可以控制ChatGPT的内存、可以重置它,删除特定的或所有记忆,或在设置中关闭此功能。

而如果你想进行一次没有记忆的对话,可使用临时聊天功能。

但是,“记忆”功能目前尚未在欧洲和韩国推出。未来,“记忆”功能也将在未来扩展到团队、企业以及即将推出的GPTs版本中。

“记忆”功能不仅能够记忆用户的明确指示,还能在对话中自动捕捉细节来提升个性化服务,并随着用户使用ChatGPT的频率增加而变得更加精准,让用户将逐渐感受到其带来的便利和效率。以下是“记忆”功能的几个实际应用示例:

  • 会议记录偏好:如果您告知ChatGPT您喜欢会议记录中包含头条、项目符号和行动项的总结,ChatGPT就会记住这点,在未来的会议记录中按照你的喜好来总结。

  • 个性化营销创意:一旦您告诉ChatGPT您拥有一家社区咖啡店,那么当你需要设计一条庆祝新店开业的社交媒体帖子时,ChatGPT就会给你提供更适合你的创意。

  • 生日贺卡定制:如果您提到自己有一个喜欢水母的幼儿,当您请求ChatGPT帮助创建生日卡片时,它可能会建议一个戴着派对帽子的水母设计。

  • 教学计划辅助:如果您是一名幼儿园老师,喜欢50分钟的课程加上后续活动,ChatGPT会在帮助您创建教学计划时考虑到这些偏好。


机器人全面进化:会跳舞、会亲嘴、会变形


日前,一段关于机器人变形的相关视频引发关注。

Robosen线上发布了一款 Megatron的40 周年限量版变形金刚机器人,可以自动变形,支持自动变身,动作娴熟,逼真,非常酷。

除了Robosen之外,波士顿动力今晨也发布了一段新视频,展现开始给机器狗装皮肤,并且完成跳舞、亲嘴等动作,非常像人类跳舞。

实际上,当前人形机器人产业火热,无论是国内还是国外,“具身智能”和人形机器人都被认为是下一个ChatGPT时刻。

行业普遍认为,具身智能是实现AGI的必经之路,而人形机器人是具身智能最适合的载体。

在中关村论坛上,银河通用机器人创始人、智源具身智能研究中心负责人王鹤认为,AI大模型更像是机器从互联网上“读万卷书”,而具身智能赋予了智能体身体,和物理世界交互、从中学习的能力,从而“行万里路”。

对于人形机器人落地,智元机器人联合创始人、上海人工智能研究院院长宋海涛认为,未来3-5年都是人形机器人向产业渗透、寻找场景的时期,5-8年才会迎来大规模商用。

小米机器人团队负责人许多称,短期内限制人形机器人落地的是硬件,移动、操作还无法实现高精度,这也导致了收集的数据可用性差。“人形机器人上肢抓取精度还在10厘米级别,距离工业机器人0.01毫米的误差精度尚远,收集了100条数据可能就几条能用来训练,数据的闭环或许比我们想象的慢。”


小红书自研通用大模型“小地瓜”将上线


据36kr报道,小红书自研通用大模型“小地瓜”已进入灰度测试阶段,同时相关的AI产品也开始接入小地瓜的AP进行测试,据说已经达到国内主流大模型的水平。

筹备了一年,小红书的大模型终于开始崭露头角。

同时有消息称,小红书正在进行新一轮估值200亿美元的融资,将是小红书Pre-IPO轮融资,对未来上市有定价参考价值。
不过,小红书回应称,该消息为不实信息。
综合早前消息,小红书2023年月活增长20%至3.12亿,销售额增长85%至37亿美元,净利润为5亿美元。同时,历经数轮融资,其投资者包括阿里巴巴、腾讯、金沙江创投、纪源资本、真格基金、高瓴资本、淡马锡等。
小红书REDtech青年技术沙龙上,小红书大模型负责人张德兵透露,小红书当时的重要研究方向围绕创作展开:“小红书承载了不同模态的内容,这些模态如果可以让创作模态大幅度下降,让用户记录和表达自己的生活的时候,能够更低成本、更加快捷,这是一个很有意思的方向。”

如今,小红书自研大模型上线在即。技术的革新,将会为小红书带来更多的想象力。

(本文首发钛媒体App,作者|任颖文、林志佳,编辑|林志佳)

万水千山总是情,点个在看行不行
继续滑动看下一个
钛媒体AGI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存