gemini_草庐IT

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

谷歌の“反击”来了！Gemini被Sora抢走的风头，现在有抢回来的势头了。在最新实测中，Gemini1.5能分析Sora视频是否AI生成。是直接给出当中关键因素的那种。比如这个经典的猫猫视频，Gemini1.5直言：它的眼睛和毛都看起来都不像是真的。还有像这段生成视频，Gemini1.5都能说出个一二三造假细节来~都说魔法打败魔法，结果Sora发布这才没几天，就火速被Gemini1.5“抓出现行”。对于Gemini1.5第一波实测结果，网友直呼：that’sscarygood，并称其为“游戏规则的改变者”。Gemini1.5第一波实测来了Gemini1.5版本突然发布，结果被对面Sora的光

【AI】技术革命较量：Google Gemini Ultra与ChatGPT-4生成对比，谁是真正的NLP霸主？

目录一、概述1.1前言1.2Genimi新版本介绍二、python代码生成2.1prompt：2.2GenimiAdvanced回复2.3Chatgpt4回复2.4GPT-4-0125-preview回复三、文本生成3.1Prompt3.2GenimiAdvance回复3.3Chatgpt4回复3.3GPT-4-0125-preview回复四、分析4.1Python代码生成4.1.1运行4.1.2文本建议4.2文本生成五、总结一、概述1.1前言 Google在2024年2月8日发布了GenimiUltra（GenimiAdvanced）正式商用版本，作为NLP人工智能的爱好者，我也在2月10

智谱AI发布国产最强大模型GLM4，理解评测与数学能力仅次于Gemini Ultra和GPT-4，编程能力超过Gemini-pro，还有对标GPTs商店的GLMs

本文来自DataLearnerAI官方网站：智谱AI发布国产最强大模型GLM4，理解评测与数学能力仅次于GeminiUltra和GPT-4，编程能力超过Gemini-pro，还有对标GPTs商店的GLMs|数据学习者官方网站(Datalearner)https://www.datalearner.com/blog/1051705395420733GLM4是智谱AI发布的第四代基座大语言模型，全称GeneralLanguageModel，最早由清华大学KEG小组再2021年发布。这个基座模型也是著名的开源国产大模型ChatGLM系列的基座模型。本次发布的第四代GLM4的能力相比此前的基座模型提升

GPT-4/Gemini大翻车，做旅行攻略成功率≈0%！复旦OSU等华人团队：Agent不会复杂任务规划

AI智能体，是目前学界炙手可热的前沿话题，被众多专家视为大模型发展的下一个方向。然而，最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、MetaAI的研究者们发现，AI智能体在现实世界的规划能力还很差。他们对GPT-4Turbo、GeminiPro、Mixtral8x7B等进行了全面评估，发现这些大模型智能体全部翻车了！即使是表现最好的，成功率也仅有0.6%。对于大模型规划能力和智能体感兴趣的研究人员，以后又有一个新榜可以刷了。（手动狗头）项目主页：https://osu-nlp-group.github.io/TravelPlanner/看来，让智能体在现实世界中完成复杂规划任务的那一天，还远着

大的要来了：谷歌Bard被曝将更名为Gemini，Ultra 1.0更强但收费、安卓App也会来

终于，谷歌去年12月承诺的GeminiUltra要与大家见面了吗？今天，推特网友爆出的谷歌Bard「大料」引发了社媒广泛热议。这位爆料者提供了一张谷歌Bard的更新日志截图，显示接下来几天会迎来一次非常重大的调整。谷歌Bard预计将从以下两个方面进行调整：一是Bard将正式更名为Gemini，并亮相GeminiUltra1.0模型；二是Gemini安卓应用程序也将到来。对于这份日志更新，有网友期待地表示，谷歌Gemini几天后将大变身，GPT-5也可能会在今年发布，这下AI圈又该热闹起来了。图源：推特@evowizzGeminiUltra1.0终于要来了去年12月，谷歌正式推出了原生多模态大模

谷歌连放大招：Gemini Pro支持中文，Bard学会画画，还上新了新模型

在竞技场超车GPT-4的Bard“抓住势头”，刚刚释出重大更新：一是集成的GeminiPro全面铺开，新增40多种语言支持，包括中文在内（之前只能用英文）。并且这些语言全部支持二次检查，也就是回答完了再主动验证一遍答案的正确性。△点击“G”图标即可开始二是终于能生成图像了。要知道，Bard诞生近一年都不支持，现在直接可用谷歌最强的Imagen2开始创作，且是免费的那种。赶紧来瞧瞧。Bard文生图终于来了虽然是免费使用，但目前Bard只支持英文指令来进行画图创作。效果看起来还是很不错的，两张官方示例图感受一下这拉满的细节：提示词：一位老年亚洲男模特剪影的侧面时尚头像，右侧有红色背光，左侧有青色背

赶超Gemini Pro，提升推理、OCR能力的LLaVA-1.6太强了

去年4月，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了LLaVA（LargeLanguageandVisionAssistant）。尽管LLaVA是用一个小的多模态指令数据集训练的，却在一些样本上展示了与GPT-4非常相似的推理结果。10月，LLaVA-1.5重磅发布，通过对原始LLaVA的简单修改，在11个基准上刷新了SOTA。现在，研究团队宣布推出LLaVA-1.6，主要改进了模型在推理、OCR和世界知识方面的性能。LLaVA-1.6甚至在多项基准测试中超越了GeminiPro。demo地址：https://llava.hliu.cc/项目地址：https://gith

准确率不足20%，GPT-4V/Gemini竟看不懂漫画！首个图像序列基准测试开源

OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注:一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificialgeneralintelligence(AGI)又迈进了一大步！可如果告诉你，GPT-4V连漫画中的人物行为都会看错,试问：元芳,你怎么看？我们来看看这幅迷你漫画系列:图片如果让生物界最高智能体——人类，也就是读者朋友来描述,你大概率会说:图片那我们来看看当机器界最高智能体——也就是GPT-4V来看这幅迷你漫画系列的时候，它会这么描述呢?图片GPT-4V作为公认的站在鄙视链顶端的机

Elasticsearch：使用 Gemini、Langchain 和 Elasticsearch 进行问答

本教程演示如何使用GeminiAPI创建embeddings并将其存储在Elasticsearch中。我们将学习如何将Gemini连接到Elasticsearch中存储的私有数据，并使用Langchian构建问答功能。准备Elasticsearch及Kibana如果你还没有安装好自己的Elasticsearch及Kibana的话，请参阅如下的文章来进行安装：如何在Linux，MacOS及Windows上进行安装ElasticsearchKibana：如何在Linux，MacOS及Windows上安装Elastic栈中的Kibana在安装的时候，请参照ElasticStack8.x的文章来进行安

Altman地位又危了？！OpenAI董事会邀请竞争对手加入，还挖角谷歌Gemini高管

Altman的地位又危险了？据知情人士透露，上个月，OpenAI董事会的AdamD'Angelo致电Databricks的首席执行官AliGhodsi，询问Ghodsi是否考虑加入OpenAI董事会。AdamD'Angelo本来找知名公司高管加入董事会这种事并不罕见，但问题是Databricks在某种程度上算是OpenAI的竞争对手。Ghodsi将Databricks定位为「OpenAI的对手公司」，业务为帮助其他公司开发人工智能应用。AliGhodsiGhodsi和Databricks的一些高管，都曾公开或私下里向客户表示，从长远来看，出于性能和安全方面的考虑，企业最好开发自己的AI模型（或