草庐IT

学术前沿

全部标签

行业前沿 | 畅想AIGC技术研究与应用实践(一)

AIGC的火热之势已经蔓延到各行各业,技术浪潮冲击下,关于AIGC创业、AIGC未来发展方向以及AIGC的应用实践等,企业、投资者以及技术产品专家们有着不一样的思考。近日,数美科技联合AMD举办的AIGC沙龙活动,邀请了经纬创投投资董事王冰醒、启元世界战略总监王思捷、AMD大中华区销售副总裁周俊杰、阿里云弹性计算资深产品专家吴天议,一起讨论畅想AIGC的技术研究与应用实践。圆桌环节由数美科技高级副总裁周秋野主持。在不改变原意的基础上,数美科技对内容干货进行了加工整理,分两期分享。希望能为大家带来关于AIGC的更多启发与思考。话题要点:· ChatGPT第一次将科技圈和大众圈连接了起来· Cha

音视频前沿技术

通信技术:5G技术、WebRTC技术视频技术:HDR技术、AV1编码技术、8K和360°视频技术、视频超分辨率技术、虚拟主播技术、区块链技术音频技术:AI技术、声源定位技术、3D音频技术、智能音箱技术、高清语音技术、语音合成技术应用领域:可穿戴音频设备、社交音视频技术、智慧教育技术、可视化分析技术、智慧城市音视频技术、音视频内容分发技术、大规模在线直播技术、智能影像识别技术、智能音视频监控技术、VR技术、AR技术5G技术:5G技术提供了更高的带宽和更低的延迟,能够支持更高质量的音视频传输。VR/AR技术:VR/AR技术可以创建虚拟现实或增强现实场景,使音视频体验更加逼真。AI技术:AI技术在音

AIGC:Stable Diffusion(一项普通人就能实现的AI前沿科技)的简介、Stable Diffusion2.0的改进、安装、使用方法(文本到图像/图像修改/超分辨率/图像修复)之详细攻略

AIGC:StableDiffusion(一项普通人就能实现的AI前沿科技)的简介、StableDiffusion2.0的改进、安装、使用方法(文本到图像/图像修改/超分辨率/图像修复)之详细攻略导读:StableDiffusion能够通过文本prompt生成图像,执行图像的超分辨率、风格迁移、图像修复等任务,随着影响力逐渐变大,基于StableDiffusion二次开发应用会越来越多。当然,它最牛叉在,它不仅是一个开源模型,而且能够在消费级GPU上就能运行,关键是效果还不错,相比AIGC的明星产品DALL-E2,StableDiffusion是一项普通人就能自行部署、自己娱乐的AIGC科技产

AI:2023年6月9日北京智源大会演讲分享之基础模型前沿技术论坛—《工程化打造AI中的CPU》、《构建一个AI系统:在LLM上应用带有RLHF来推进定制》、《多模态预训练的进展回顾与展望》、《扩展大

AI:2023年6月9日北京智源大会演讲分享之基础模型前沿技术论坛—《工程化打造AI中的CPU》、《构建一个AI系统:在LLM上应用带有RLHF来推进定制》、《多模态预训练的进展回顾与展望》、《扩展大型语言模型:从幂律到稀疏性》导读:《工程化打造AI中的CPU》讲述了基础大模型在AI中的重要性体现在提供计算能力、对产业发展产生重大影响,以及决定后续模型的能力和合规性。Aquila天鹰语言模型系列旨在打造中英文双语能力的大模型,并采用循环迭代的生产流水线。该系列包括基础模型和针对对话和代码生成进行微调训练的模型。评测对大模型的重要性体现在高昂的训练成本和能力复杂性。FlagEval作为评测体系提

AI绘画发展史(伪):从免费到吃屎;YSDA·自然语言处理课程8K Star;伯克利CS285·深度强化学习课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子📢AI绘画发展史(伪):不能提升生产力的创新,都是伪创新微博博主@西仔LittileC绘制了一份AI绘画发展史,展示了从业者的担忧——并非抗拒技术进步带来的竞争和压力,而是担心已有行业的种种乱象在绘画行业重演,最终导致所有用户被动『吃屎』。大平台免费致使从业人数减少、平台收取低价使用费用、用户必须购买会员/按月订阅/按年订阅才能使用、内容趋同千人一面···这个发展历程,我们太熟悉了···工具&框架🚧『Monocraft』Minecraft前端字体https://github.com/IdreesInc/Monocrafthttps://idr

每日学术速递5.19

CV - 计算机视觉 |  ML-机器学习 |  RL- 强化学习 |NLP自然语言处理 Subjects: cs.CV1.OntheHiddenMysteryofOCRinLargeMultimodalModels 标题:论大型多模态模型中OCR的隐藏奥秘作者:YuliangLiu,ZhangLi,HongliangLi,WenwenYu,MingxinHuang,DezhiPeng,MingyuLiu,MingruiChen,ChunyuanLi,LianwenJin,XiangBai文章链接:https://arxiv.org/abs/2305.07895项目代码:https://git

【学术探讨】万能密码原理剖析

「作者主页」:士别三日wyx「作者简介」:CSDNtop100、阿里云博客专家、华为云享专家、网络安全领域优质创作者「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》【万能密码】,顾名思义,就是可以【登录任意网站】的账号和密码,这篇文章就跟大家探讨一下,万能密码究竟是如何实现登录的。首先了解一下登录功能的逻辑。我们平时登录账号时,如果是第一次登录,系统会提示我们注册账号,并将我们注册的账号和密码保存到数据库中。当我们再次登录时,系统会将我们输入的账号和密码和数据库中的数据进行匹配,匹配成功能登录。这就意味着我们需要知道一个已经注册过并且正确的账号和密码才能进行登录。那如果

投稿时要求注册ORCID,这张学术界身份证到底有哪些用处?

您是否经常遇到向国际期刊投稿时需要提供ORCID账号进行登录呢?又是否在我们看到喜欢的文献时,不免被其作者圈粉,忍不住要去了解这位学者的其他作品和动向时却又很难搜到准确信息?对中国学者来说,由于投到国际期刊时使用的都是汉语拼音,导致大量姓名被张冠李戴,此时我们检索出来的信息,或许根本只是同名同姓而非同一个人,对于其他国家科研工作者也有相同的问题。有没有一个工具,可以让全球的研究者都有一个独立的ID,能够关联既往发表期刊,而不会搞混呢?有的,这就是ORCID。ORCID的全称是OpenResearcherandContributorID,开放研究者与贡献者身份识别码,是一家开放的国际性非盈利组织

行业前沿 | 数字孪生技术发展研究

随着无人机作业自主性、智能化、多任务等方面要求的提高,无人机从单机作业发展到集群作业,针对无人机集群协同算法开发过程中如何将集群协同算法从仿真环境迁移至真实环境且保证算法可靠性,一直是无人系统方向研究的重点。数字孪生仿真以多维多空间多尺度模型将物理实体以数字化呈现,以多源异构的数据为纽带,将物理实体与虚拟空间运行实时连接、实时映射、实时刷新,以保证一致性。最终目的是借助虚拟空间的仿真、可视化等手段,基于数字孪生技术进一步提升物理实体验证能力。01国内外发展现状【国外发展现状】美国国防部最早提出利用数字孪生技术,用于航空航天飞行器的健康维护与保障。首先在数字空间建立真实飞机的模型,并通过传感器实

MP3→MP4 根据音乐自动生成视频;入职必备!看看新东家的工作强度;斯坦福大学·计算拓扑学电子书;自监督模型课程;前沿论文 | ShowMeAI资讯日报

👀日报合辑|📆电子月刊|🔔公众号下载资料|🍩@韩信子工具&框架🚧『VideoKilledTheRadioStar』根据音乐自动生成视频https://github.com/dmarx/video-killed-the-radio-starVideoKilledTheRadioStar是一个自动音乐视频制作器,给定一个MP3或YoutubeURL就可以制作视频。它的原理是:①根据该文本提示生成一个图像(使用stablediffusion)。②将生成的图像作为init_image,与文本提示重新组合,生成与第一个图像相似的变化。这将产生一个基于原始文本提示的极其相似的图像序列。③图像被智能地重新排