草庐IT

Sora的影像

全部标签

重磅!OpenAI发布文生视频模型Sora——视频模型的奇点或许来临!!

文章目录1卓越能力1.160s超长时间高度详细复杂的场景1.2复杂的相机运动1.3同一场景多个镜头2技术原理3不足4安全战略5碎碎念OpenAI发布文生视频模型Sora——视频模型的奇点或许来临!!初七啦,得开始工作了,没想到第一天就这么劲爆!今天OpenAI迎来重大更新——发布视频模型Sora!!官网Sora(openai.com)说实话有点惊艳,在AI圈子里好多头部内容创作者看到都禁不住国粹了!除了能够仅根据文本说明生成视频外(文生视频)该模型还能够获取现有的静止图像并从中生成视频,从而准确无误地对图像内容进行动画处理,并注重小细节(图生视频)该模型还可以拍摄现有视频并对其进行扩展或填充缺

AI开启手机摄影新时代:三星Galaxy S24 Ultra影像解读

在全球科技领域,生成式AI无疑是当前最为炙手可热的亮点,不少行业专家和业界领袖都纷纷预言,生成式AI技术必将重塑千行百业。那么是否有人想过,如果生成式AI技术被应用在智能手机上,又会带来怎样翻天覆地的变革?2024年1月25日,三星正式面向中国市场推出GalaxyS24系列旗舰智能手机,系列中的超大杯机型GalaxyS24Ultra以强大的AI影像功能让很多体验者感叹:“原来手机摄影还可以这样玩!”超视觉影像让影像创作更自由作为一款以影像功能见长的旗舰智能手机,三星GalaxyS24Ultra搭载了全新的AI影像工具套件——超视觉影像,全链路赋能影像创作体验。在拍摄前期,超视觉影像的智能场景识

文献速递:生成对抗网络医学影像中的应用——3DGAUnet:一种带有基于3D U-Net的生成器的3D生成对抗网络

文献速递:生成对抗网络医学影像中的应用——3DGAUnet:一种带有基于3DU-Net的生成器的3D生成对抗网络给大家分享文献的主题是生成对抗网络(Generativeadversarialnetworks,GANs)在医学影像中的应用。文献的研究内容包括同模态影像生成、跨模态影像生成、GAN在分类和分割方面的应用等。生成对抗网络与其他方法相比展示出了优越的数据生成能力,使它们在医学图像应用中广受欢迎。这些特性引起了医学成像领域研究人员的浓厚兴趣,导致这些技术在各种传统和新颖应用中迅速实施,如图像重建、分割、检测、分类和跨模态合成。01文献速递介绍胰腺导管腺癌(PDAC)代表了一个重大的公共卫

Camera2开发基础知识篇——手机影像参数

前言这段时间刚入职,导师安排任务做Camera2开发,用于集成一些图像处理算法。当被问及拍照流程以及HDR算法相关知识时,发觉还很欠缺,所以写篇文章记录下。一、手机影像主要参数1、分辨率分辨率指图像的像素数量,较高的分辨率可以提供更多的细节和清晰度。分辨率的单位:描述分辨率的单位有dpi(点每英寸)、lpi(线每英寸)、ppi(像素每英寸)和PPD(PixelsPerDegree角分辨率,像素每度)。但只有lpi是描述光学分辨率的尺度的。dpi是指打印分辨率(每英寸所能打印的点数,即打印精度),ppi是图像的采样率(在图像中,每英寸所包含的像素数目)。分辨率的分类:显示器分辨率(显示器本身的物

C++ GDAL提取多时相遥感影像中像素随时间变化的数值数组

  本文介绍基于C++语言GDAL库,批量读取大量栅格遥感影像文件,并生成各像元数值的时间序列数组的方法。  首先,我们来明确一下本文所需实现的需求。现在有一个文件夹,其中包含了很多不同格式的文件,如下图所示。  其中,我们首先需要遍历这一文件夹,遴选出其中所有类型为.bmp格式的栅格遥感影像文件(一共有6个),并分别读取文件(已知这些遥感影像的行数、列数都是一致的);随后,将不同遥感影像的同一个位置的像素的数值进行分别读取,并存储在一个数组中。例如,最终我们生成的第一个数组,其中共有6个元素,分别就是上图所示文件夹中6景遥感影像各自(0,0)位置的像元数值;生成的第二个数组,其中也是6个元素

通过Stable Diffusion生成虚假的遥感影像

简介这两天玩了一下stablediffusion,是真的好玩!然后我在想遥感有没有相关的生成模型,找了一下,还真找到了(https://github.com/xiaoyuan1996/Stable-Diffusion-for-Remote-Sensing-Image-Generation/tree/main)。该模型的作者是空天院的Zhiqiangyuan,他提供了相关的训练代码、预测代码、已经训练好的模型等。[外链图片转存中…(img-lOFMZR6f-1705867377350)]生成效果因为我也不想装代码环境,就只下载了模型加载到stablediffusion中看看生成的遥感影像的效果。

Opencv C++ SIFT特征提取(单图像,多图像)+如何设置阈值+如何对文件夹进行批处理+如何设置掩膜裁剪影像

一、何谓SITF特征提取,它有什么作用?SIFT(Scale-InvariantFeatureTransform)是一种用于图像处理和计算机视觉的特征提取算法。由DavidLowe于1999年首次提出,它是一种非常有效的局部特征描述符,具有尺度不变性、旋转不变性和对部分遮挡的鲁棒性。SIFT特征提取的主要步骤包括:尺度空间极值检测(Scale-SpaceExtremaDetection):通过不同尺度的高斯模糊图像,检测图像中的局部最小和最大值,形成尺度空间。关键点定位(KeyPointLocalization):在尺度空间中,通过对极值点的局部区域进行拟合,找到关键点的准确位置。关键点方向分

文献速递:人工智能医学影像分割---“先切割再分割:基于裁剪的大型生物医学图像分割中的上下文保留”

文献速递:人工智能医学影像分割—“先切割再分割:基于裁剪的大型生物医学图像分割中的上下文保留”01文献速递介绍Medicalimagesegmentationisakeystepinmedicalresearch,diagnosis,treatment,andsurgicalplanning.Asingle3Dmedicalimage,suchasaCToranMRIscan,canbeuptohundredsofmegabytesinsize[1].Two-dimensionalimagessuchasradiographsordigitalspecimenslidesareoftentho

【超图】SuperMap iClient3D for WebGL/WebGPU ——地形影像

作者:taco       号外!号外!开新坑了!开新坑了!对于一个代码小白来讲,设置可能是刚接触开发的人(还没接触准备接触)的人来说。对于读代码或是在对产品的使用上会存在许许多多的疑惑。接下来的话准备开个新坑,帮大家了解超图官方示例中不同功能的数据是如何制作的。每一句代码都是什么意思。方便大家更好的入门。更好的开发。       本系列博客从示例代码直接入手,关于环境配置,下载等内容。可以参考以前的博客——新产品使用指南中环境配置相关部分。https://mcaitaco.blog.csdn.net/article/details/125131936https://mcaitaco.blog

【Python&RS】基于GDAL镶嵌拼接遥感影像

    没啥好说的,处理高分辨率影像时,数据高达几十G。用ENVI或者ArcGIS进行影像的拼接时,往往会出现未响应的情况。出现未响应的话,运气好等个一晚上可能会动一动,运气不好就等着强制关闭重做吧。        所以搞了一个Python进行拼接操作的代码,虽然速度不算快,但至少不会未响应。同时如果对代码进行一些改进,还可以进行批量拼接的操作,百利而无一害。一、导入GDAL库fromosgeoimportgdal二、查看影像信息        为了凑字数的,可以查看影像的投影、宽度、高度、波段数等信息。不过需要注意的是在ENVI中没有投影坐标系,只有地理坐标系是做不了镶嵌拼接的。