哲学家_草庐IT

Unix哲学之编程原则

1Unix哲学Unix哲学注重实效，立足于丰富的经验，并不会在正规方法学和标准中找到它，它更接近于隐性的半本能的知识。Unix程序员在探索开发的过程中积累的经验，非Unix的程序员也能够从这些经验中获益。(1) 让每个程序就做好一件事。如果有新任务，就重新开始，不要往原程序中加入新功能而搞得复杂。(2) 假定每个程序的输出都会成为另一个程序的输入，哪怕那个程序还是未知的，输出中不要有无关的信息干扰。(3) 尽可能早地将设计和编译的软件投入试用，对拙劣的代码别犹豫，扔掉重写。(4) 优先使用工具而不是拙劣的帮助来减轻编程任务的负担，工欲善其事，必先利其器。2编码原则Unix哲学中的内容不是这些先

把大模型当CPU，前阿里云首席安全科学家创业项目曝光

衡宇发自凹非寺量子位|公众号QbitAI大模型创业，“最安全”的人来了！吴翰清，前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后，现在被曝投身AI创业。量子位了解到，他在杭州成立了一家名为KMind的公司，年中时已经完成一轮融资。KMind创始团队堪称大牛云集、星光四溢，吴翰清只是代表之一，据悉还有西湖大学某实验室的博导加盟，同为公司联创。而且吴翰清在KMind担任的是CEO角色，技术条线有另一位高人把控，担任CTO。量子位独家获悉，这位曾经“让马云安枕无忧的男人”现在要做的事，关乎一个新颖的概念：个人AI计算机。个人AI计算机是什么？今年5月，吴翰清的状态在阿里内部显示为“离职”时

2023 CSIG青年科学家会议丨多模态大模型时代下的文档图像处理

近日，由中国图象图形学学会青年工作委员会发起的“第十九届中国图象图形学学会青年科学家会议”在广州召开。会议面向国际学术前沿与国家战略需求，聚焦最新前沿技术和热点领域，邀请各界专家与青年学者进行总计超200场的高水平学术深度交流，促进图象图形领域“产学研”合作。一、前言引入在会上，来自合合信息的丁凯博士在“垂直领域大模型论坛”作题为《文档图像大模型的思考与探索》的报告，分享了关于文档大模型的最新研究成果以及对未来的展望。他指出，尽管以Chat-GPT为代表的大语言模型和GPT4-V多模态大模型在文档领域取得了显著成果，但OCR文档图像识别等领域的核心问题仍然存在。如场景及版式的多样性、采集设备的

java - 真正的大数据如何在数据科学家老死之前导入HDFS？

我是Hadoop的新手并且相信我开始看到数据分析(“离线”)与超低延迟的网络应用程序世界有多少不同.我仍在努力理解的一件重要事情是，真正的“大数据”最初是如何进入HDFS的。假设我在各种系统(RDBMS、NoSQL、日志数据等)中存储了500TB的数据。我的理解是，如果我想编写MR作业来查询和分析这些数据，我需要先将其全部导入/摄取到HDFS。但即使我在每个不同的系统和我的Hadoop集群之间有一个1Gbps的网络连接，这也是500TB=500*1000Gb=500,000GB的数据，在1Gbps下，是500,000秒或~138小时将所有数据移植到我的HDFS集群上。差不多一周了。而且

【华为OD机考统一考试机试C卷】考古学家考古问题（C++ Java JavaScript Python）

华为OD机考:统一考试C卷+D卷+B卷+A卷2023年11月份，华为官方已经将华为OD机考：OD统一考试（A卷/B卷）切换到OD统一考试（C卷）和OD统一考试（D卷）。根据考友反馈：目前抽到的试卷为B卷或C卷/D卷，其中C卷居多，按照之前的经验C卷D卷部分考题会复用A卷/B卷题，博主正积极从考过的同学收集C卷和D卷真题，可以查看下面的真题目录。真题目录：华为OD机考机试真题目录（C卷+D卷+B卷+A卷）+考点说明专栏：2023华为OD机试(B卷+C卷+D卷)（C++JavaJSPy）华为OD面试真题精选：华为OD面试真题精选在线OJ：点击立即刷题，模拟真实机考环境华为OD机考B

书生·浦语大模型全链路开源体系（陈恺|上海人工智能实验室青年科学家）-听课笔记

书生·浦语大模型系列轻量级：InternLM-7B70亿模型参数1000亿训练token数据长语境能力，支持8K语境窗口长度通用工具调用能力，多种工具调用模板中量级：InternLM-20B200亿模型参数，在模型能力与推理代价间取得平衡采用深而窄的结果，降低推理计算量但提高推理能力4K训练语境长度，推理时可外推至16K重量级：1230亿模型参数，强大的性能极强推理能力、全面的知识覆盖面、超级理解能力与对话能力准确的API调用能力，可实现各类Agent从模型到应用流程-浦语大模型全链路开源体系生态数据：书生·万卷2TB数据，涵盖多种模态与任务预训练：InternLM-Train并行训练，极致优

Nature 新研究发布，GPT 驱动的机器人化学家能够自行设计和进行实验，这对科研意味着什么？

文章目录前言揭秘Coscientist不到四分钟，设计并改进了程序能力越大，责任越大前言有消息称，AI大模型“化学家”登Nature能够自制阿司匹林、对乙酰氨基酚、布洛芬，甚至连复杂的钯催化交叉偶联反应，也能完成。要知道，2010年诺贝尔化学奖获得者就因为对该反应的研究才获奖，这类反应可以高效地构建碳-碳键，生成很多以往很难甚至无法合成的物质。揭秘Coscientist下面我们来看看化学家Coscientist到底长什么样子。Coscientist由卡内基梅隆大学的研究团队开发。前不久谷歌DeepMind造的AI化学家也登上了Nature，号称一口气能预测220万种新材料。而现在Coscien

Meta 首席科学家杨立昆：OpenAI 已沦为微软的“合同研究机构”

12月28日消息，Meta首席AI科学家杨立昆（YannLeCun）日前接受《连线》杂志采访，对萨姆・阿尔特曼掌舵的OpenAI进行了猛烈抨击。杨立昆直言，OpenAI已偏离了最初设定的非盈利道路，且沦为了微软的“合同研究机构”。“现在，他们基本上是微软的合同研究机构，尽管他们有一定的独立性。”（IT之家注：报道原文为“contractresearchhouse”，也可被称为“委托研究机构”，原为临床医学术语，指接受药厂或生技公司委托进行研究服务的机构，提供新药开发时所需的临床、非临床试验）OpenAI在2015年建立之初曾采用非盈利模式，不过在2019年成立了一家采用盈利模式的子公司，投资上

四分钟成功复现诺奖！CMU开发GPT-4化学家，自主编码操控机器人颠覆化学研究登Nature

ChatGPT大模型爆火这一年，没想到竟颠覆了整个化学领域。先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构，随后微软推出的MatterGen，大大加速了设计所需材料特性的速度。今天，CMU和EmeraldCloudLab的研究团队开发了一种全新自动化AI系统——Coscientist，荣登Nature。它可以设计、编码和执行多种反应，完全实现了化学实验室的自动化。图片实验评测中，Coscientist利用GPT-4，在人类的提示下检索化学文献，成功设计出一个反应途径来合成一个分子。GPT-4遍历整个互联网上的说明书，并选择数据库中最好的试剂盒和试剂，在现实中制造分子。

2023第二届“清华社杯”大学生算法大赛解题报告(流水账版) | 珂学家

前言整体评价有幸参加这场比赛，感觉打出了最近最好的状态。这场比赛题目出的挺有质量的，大概4道easy+easymid，4道mid+hard，2道超级hard的分布。比赛中一直“遥遥领先”,唯一的岔子出在I题，这题卡语言了，哭了，好在最后换c++卡过，最后有惊无险，因为只有2个9题，8题虽然蛮多的，但所幸之前的巨大优势，依旧遥遥领先，^_^。A.变化的矩阵签到题，但是这题有争议，因为输出格式没描述清楚。其实按照惯例，一般对浮点数的输出，是保留6位小数，当然最好需要spj验证。B.吃鸡梦之队思路：二分，check枚举交叉构造挺有意思的一道题，因为要求满足条件的最小值，往往用二分的思路。这题难在c