gemini_草庐IT

暴打GPT-3.5，谷歌Gemini大杀器官宣免费用！最强代码生成工具上线支持20+语言

谷歌年底开发者福利大放送来了！谷歌Gemini发布一周之后，面向开发者的API也终于上线了。目前，不管是GeminiPro，还是GeminiProVision，都可以免费体验。虽然每分钟最多支持60次请求，但基本上可以满足大多数应用程序开发的需求。而到了明年初上线时，谷歌将正式开启收费。API定价，也将和GPT-3.5看齐，都是0.001刀每千token输入，0.002刀每千token输出。GeminiProGPT-3.5具体来说：-目前支持32K的上下文窗口，之后还会进一步扩大。-而其他基本的功能也都支持：函数调用、嵌入、语义检索、自定义知识。-支持全球180多个国家和地区的38种语言。-支

极智一周 | AI 算力国产化、通义开源、Gemini、鸿蒙、蔚来 And so on

欢迎关注我的公众号[极智视界]，获取我的更多技术分享大家好，我是极智视界，带来本周的[极智一周]，关键词：AI算力国产化、通义开源、Gemini、鸿蒙、蔚来Andsoon。邀您加入我的知识星球「极智视界」，星球内有超多好玩的项目实战源码和资源下载，链接：https://t.zsxq.com/0aiNxERDq极智视界本周热点文章回顾，(1)AI算力国产化系列本周续写解读国产AI算力系列，输出六章。璧仞芯片禁令焦点，摩尔线程显卡希望，沐曦夹缝中求生，燧原稳中求胜，灵汐类脑芯片独树一帜，地平线发力智能车载征程。系列声明：已输出十余篇"解读国产AI算力"文章成系列，引起业界反响与共鸣。而，分析难免涉

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

大模型现在真的是越来越卷了！11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了，赶在年底之前仓促发布了超大模型Gemini，卷起了多模态，甚至不惜「视频造假」。就在今天，微软正式发布了曾在11月Ignite大会上预告的Phi-2！凭借着2.7B的参数，「小语言模型（SLM）」Phi-2几乎打穿了所有13B以下的大模型——包括谷歌最新发布的GeminiNano2。通过模型扩展和训练数据管理方面的创新，Phi-2展现了出色的推理和语言理解能力，在复杂的基准测试中，Phi-2的性能可以打平比自己大25倍的模型，甚至略占上风。它用非常「苗条」的尺

微软发文：27 亿参数的 Phi-2 AI 模型性能优于谷歌 32 亿参数的 Gemini Nano-2

12月13日消息，微软公司今天发布新闻稿，表示旗下的Phi-22.7B模型，在多个方面都优于谷歌发布的GeminiNano-23.2B。Phi-22.7B模型IT之家今年11月报道，微软在Ignite2023大会上，宣布了拥有27亿参数的Phi-2，性能方面相比较此前版本有明显提升。微软于今年6月发布Phi-1，只有13亿参数，适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练，在基准测试中的表现比同类模型高出10倍。微软今年9月更新发布了Phi-1.5版本，同样为13亿参数，可以写诗、写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能

为Gemini AI大模型找场景谷歌Project Ellman项目曝光

谷歌团队提出一个设想，用AI技术处理用户照片及搜索引擎查询信息，全面分析出用户的生活是怎样的，这个项目名叫“ProjectEllmann”。按照最初的设想，ProjectEllmann会用LLM（比如Gemini）提取信息，从用户的照片中找到特定模式，然后制作一个聊天机器人，让它精准回答问题。谷歌宣称Ellmann将会成为“个人生活故事讲述者”。听起来很有趣，不过谷歌到底是想将Ellmann功能植入谷歌Photos，还是放进其它产品？目前还不得而知。谷歌Photos拥有10多亿用户，存储了4万亿张照片或者视频。目前谷歌正在利用AI技术优化产品线，Ellmann只是利用方式之一。几天前谷歌推出G

[论文笔记] Gemini: A Computation-Centric Distributed Graph Processing System

Gemini:AComputation-CentricDistributedGraphProcessingSystemGemini:以计算为中心的分布式图处理系统[Paper][Slides][Code]OSDI’16摘要提出了Gemini,一个分布式图处理系统,应用了多种针对计算性能的优化以在效率之上构建可扩展性.Gemini采用:稀疏-稠密信号槽抽象,将混合推拉计算模型扩展到分布式场景基于分块的划分(chunk-basedpartition)方案,可实现低开销的横向扩展和保留局部性的结点访问压缩结点索引访问的双重表示方案用于高效节点内内存访问的NUMA感知子划分用于改善节点间和节点内的负载

【震撼发布】谷歌Gemini大模型登场！GPT-4霸主地位岌岌可危？

【震撼发布】谷歌Gemini大模型登场！GPT-4霸主地位岌岌可危？2023年12月7日，谷歌AI宣布发布新一代基于Transformer架构的大模型Gemini。谷歌首席执行官皮查伊表示，Gemini是谷歌迄今为止规模最大，能力最强的人工智能语言模型。Gemini的发布也将对GPT-4的霸主地位构成挑战。GPT-4是目前最先进的语言模型之一，但Gemini在多个方面都取得了突破，有可能成为新的行业标准。Gemini版本介绍谷歌当天发布的Gemini1.0共分为Ultra,Pro和Nano三个版本：GeminiUltra：能力最强，复杂度最高，能够处理最为高度复杂的任务，GeminiPro：能

MMLM之Gemini：《Introducing Gemini: our largest and most capable AI model》的翻译与解读

MMLM之Gemini：《IntroducingGemini:ourlargestandmostcapableAImodel》的翻译与解读导读：2023年12月6日，Google重磅发布大规模多模态模型Gemini，表示了Google语言模型发展到了一个新阶段，其多模态和通用能力明显优于目前大部分主流大模型。这是Google目前最大、最强大的人工智能模型。Gemini从底层构建为多模式，可以概括和无缝地理解、操作和组合不同类型的信息，包括文本、图像、音频、视频和代码。这意味着它具有复杂的多模态推理和高级编码能力。通过可以驱动Google产品，提供更先进的客户服务互动，用于内容创作和营销活动，并

谷歌Gemini被曝视频造假！多模态视频竟是剪辑配音，击败GPT-4靠「作弊」？

谷歌的宣传视频，竟然作假了？在谷歌昨天发布的Gemini的宣传视频中，所有人都被那一段6分钟一镜到底的互动视频惊艳到了。图片一天之内有720万的播放量。网友惊呼，Gemini看起来就像一个能随时事无巨细地向你解释一切的朋友。图片视频中看起来，好像Gemini能够实时地感知人类的动作，并且直接做出语音回应。然而，有越来越多的人质疑demo的真实性。彭博社的ParmyOlsen，第一个质疑视频造假。图片随后，谷歌官博也放出了解释——是的，视频的确有后期制作和剪辑的成分。根据官方发布的一个技术文档，Gemini所有的这些交互都不是实时感知到的，而是通过提示词问出来的。比如：图片视频中显示，似乎Gem

Gemini上线首日：用户褒贬不一，演示被质疑「造假」，谷歌承认了

「谷歌，这就有点尴尬了。」没有想到，Gemini上线头一天，热门评论会是这个样子。本周三，谷歌的Gemini让生成式AI进入了原生多模态时代。人们第一时间涌入新模型加持的Bard想要试试AI的能力，结果给出的评价褒贬不一。其中最值得注意的是有人指出，Gemini在发布时，谷歌给出的一系列Demo中最令人眼花缭乱的部分是伪造的。名为《Hands-onwithGemini:InteractingwithmultimodalAI》的视频现在的播放量已经有140万次，其中展示了谷歌认为自己「最喜欢的与Gemini的交互案例」，展示了多模态模型（即它理解并混合语言和视觉理解）如何灵活地响应各种输入。谷歌