本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。为应对新一轮技术竞赛,谷歌还在不断出后手。这两天,一个名叫PaLM-E的大模型在AI学术圈疯狂刷屏。它能只需一句话,就让机器人去厨房抽屉里拿薯片。即便是中途干扰它,它也会坚持执行任务。PaLM-E拥有5620亿参数,是GPT-3的三倍多,号称史上最大规模视觉语言模型。而它背后的打造团队,正是谷歌和柏林工业大学。作为一个能处理多模态信息的大模型,它还兼具非常强的逻辑思维。比如能从一堆图片里,判断出哪个是能滚动的。还会看图做算数:有人感慨:这项工作比ChatGPT离AGI更近一步啊!而另一边,微软其实也在尝试ChatGPT