草庐IT

哲学家

全部标签

Unix哲学之编程原则

1Unix哲学Unix哲学注重实效,立足于丰富的经验,并不会在正规方法学和标准中找到它,它更接近于隐性的半本能的知识。Unix程序员在探索开发的过程中积累的经验,非Unix的程序员也能够从这些经验中获益。(1) 让每个程序就做好一件事。如果有新任务,就重新开始,不要往原程序中加入新功能而搞得复杂。(2) 假定每个程序的输出都会成为另一个程序的输入,哪怕那个程序还是未知的,输出中不要有无关的信息干扰。(3) 尽可能早地将设计和编译的软件投入试用,对拙劣的代码别犹豫,扔掉重写。(4) 优先使用工具而不是拙劣的帮助来减轻编程任务的负担,工欲善其事,必先利其器。2编码原则Unix哲学中的内容不是这些先

把大模型当CPU,前阿里云首席安全科学家创业项目曝光

衡宇发自凹非寺量子位|公众号QbitAI大模型创业,“最安全”的人来了!吴翰清,前阿里云首席安全科学家、P10级研究员在今年5月离职阿里后,现在被曝投身AI创业。量子位了解到,他在杭州成立了一家名为KMind的公司,年中时已经完成一轮融资。KMind创始团队堪称大牛云集、星光四溢,吴翰清只是代表之一,据悉还有西湖大学某实验室的博导加盟,同为公司联创。而且吴翰清在KMind担任的是CEO角色,技术条线有另一位高人把控,担任CTO。量子位独家获悉,这位曾经“让马云安枕无忧的男人”现在要做的事,关乎一个新颖的概念:个人AI计算机。个人AI计算机是什么?今年5月,吴翰清的状态在阿里内部显示为“离职”时

2023 CSIG青年科学家会议丨多模态大模型时代下的文档图像处理

近日,由中国图象图形学学会青年工作委员会发起的“第十九届中国图象图形学学会青年科学家会议”在广州召开。会议面向国际学术前沿与国家战略需求,聚焦最新前沿技术和热点领域,邀请各界专家与青年学者进行总计超200场的高水平学术深度交流,促进图象图形领域“产学研”合作。一、前言引入在会上,来自合合信息的丁凯博士在“垂直领域大模型论坛”作题为《文档图像大模型的思考与探索》的报告,分享了关于文档大模型的最新研究成果以及对未来的展望。他指出,尽管以Chat-GPT为代表的大语言模型和GPT4-V多模态大模型在文档领域取得了显著成果,但OCR文档图像识别等领域的核心问题仍然存在。如场景及版式的多样性、采集设备的

java - 真正的大数据如何在数据科学家老死之前导入HDFS?

我是Hadoop的新手并且相信我开始看到数据分析(“离线”)与超低延迟的网络应用程序世界有多少不同.我仍在努力理解的一件重要事情是,真正的“大数据”最初是如何进入HDFS的。假设我在各种系统(RDBMS、NoSQL、日志数据等)中存储了500TB的数据。我的理解是,如果我想编写MR作业来查询和分析这些数据,我需要先将其全部导入/摄取到HDFS。但即使我在每个不同的系统和我的Hadoop集群之间有一个1Gbps的网络连接,这也是500TB=500*1000Gb=500,000GB的数据,在1Gbps下,是500,000秒或~138小时将所有数据移植到我的HDFS集群上。差不多一周了。而且

【华为OD机考 统一考试机试C卷】考古学家考古问题(C++ Java JavaScript Python)

华为OD机考:统一考试C卷+D卷+B卷+A卷2023年11月份,华为官方已经将华为OD机考:OD统一考试(A卷/B卷)切换到OD统一考试(C卷)和OD统一考试(D卷)。根据考友反馈:目前抽到的试卷为B卷或C卷/D卷,其中C卷居多,按照之前的经验C卷D卷部分考题会复用A卷/B卷题,博主正积极从考过的同学收集C卷和D卷真题,可以查看下面的真题目录。真题目录:华为OD机考机试真题目录(C卷+D卷+B卷+A卷)+考点说明专栏:2023华为OD机试(B卷+C卷+D卷)(C++JavaJSPy)华为OD面试真题精选:华为OD面试真题精选在线OJ:点击立即刷题,模拟真实机考环境华为OD机考B

书生·浦语大模型全链路开源体系(陈恺|上海人工智能实验室 青年科学家)-听课笔记

书生·浦语大模型系列轻量级:InternLM-7B70亿模型参数1000亿训练token数据长语境能力,支持8K语境窗口长度通用工具调用能力,多种工具调用模板中量级:InternLM-20B200亿模型参数,在模型能力与推理代价间取得平衡采用深而窄的结果,降低推理计算量但提高推理能力4K训练语境长度,推理时可外推至16K重量级:1230亿模型参数,强大的性能极强推理能力、全面的知识覆盖面、超级理解能力与对话能力准确的API调用能力,可实现各类Agent从模型到应用流程-浦语大模型全链路开源体系生态数据:书生·万卷2TB数据,涵盖多种模态与任务预训练:InternLM-Train并行训练,极致优

Nature 新研究发布,GPT 驱动的机器人化学家能够自行设计和进行实验,这对科研意味着什么?

文章目录前言揭秘Coscientist不到四分钟,设计并改进了程序能力越大,责任越大前言有消息称,AI大模型“化学家”登Nature能够自制阿司匹林、对乙酰氨基酚、布洛芬,甚至连复杂的钯催化交叉偶联反应,也能完成。要知道,2010年诺贝尔化学奖获得者就因为对该反应的研究才获奖,这类反应可以高效地构建碳-碳键,生成很多以往很难甚至无法合成的物质。揭秘Coscientist下面我们来看看化学家Coscientist到底长什么样子。Coscientist由卡内基梅隆大学的研究团队开发。前不久谷歌DeepMind造的AI化学家也登上了Nature,号称一口气能预测220万种新材料。而现在Coscien

Meta 首席科学家杨立昆:OpenAI 已沦为微软的“合同研究机构”

12月28日消息,Meta首席AI科学家杨立昆(YannLeCun)日前接受《连线》杂志采访,对萨姆・阿尔特曼掌舵的OpenAI进行了猛烈抨击。杨立昆直言,OpenAI已偏离了最初设定的非盈利道路,且沦为了微软的“合同研究机构”。“现在,他们基本上是微软的合同研究机构,尽管他们有一定的独立性。”(IT之家注:报道原文为“contractresearchhouse”,也可被称为“委托研究机构”,原为临床医学术语,指接受药厂或生技公司委托进行研究服务的机构,提供新药开发时所需的临床、非临床试验)OpenAI在2015年建立之初曾采用非盈利模式,不过在2019年成立了一家采用盈利模式的子公司,投资上

四分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature

ChatGPT大模型爆火这一年,没想到竟颠覆了整个化学领域。先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构,随后微软推出的MatterGen,大大加速了设计所需材料特性的速度。今天,CMU和EmeraldCloudLab的研究团队开发了一种全新自动化AI系统——Coscientist,荣登Nature。它可以设计、编码和执行多种反应,完全实现了化学实验室的自动化。图片实验评测中,Coscientist利用GPT-4,在人类的提示下检索化学文献,成功设计出一个反应途径来合成一个分子。GPT-4遍历整个互联网上的说明书,并选择数据库中最好的试剂盒和试剂,在现实中制造分子。

2023第二届“清华社杯”大学生算法大赛 解题报告(流水账版) | 珂学家

前言整体评价有幸参加这场比赛,感觉打出了 最近最好的状态。这场比赛题目出的挺有质量的,大概4道easy+easymid,4道mid+hard,2道超级hard的分布。比赛中一直“遥遥领先”,唯一的岔子出在I题,这题卡语言了,哭了,好在最后换c++卡过,最后有惊无险,因为只有2个9题,8题虽然蛮多的,但所幸之前的巨大优势,依旧遥遥领先,^_^。A.变化的矩阵签到题,但是这题有争议,因为输出格式没描述清楚。其实按照惯例,一般对浮点数的输出,是保留6位小数,当然最好需要spj验证。B.吃鸡梦之队思路:二分,check枚举交叉构造挺有意思的一道题,因为要求满足条件的最小值,往往用二分的思路。这题难在c