草庐IT

point_conv

全部标签

Pytorch中的卷积与反卷积(conv2d和convTranspose2d)

卷积卷积是特征提取的常用操作,卷积可以改变图片的通道和大小,相比全连接操作,卷积可以减少计算量,并且充分融合图像的局部特征。importtorchimporttorch.nnasnnx=torch.randn(1,1,4,4)model=nn.Conv2d(in_channels=1,out_channels=1,kernel_size=3,stride=1,padding=0)output=model(x)print('outputshape',output.shape)  importtorchimporttorch.nnasnnx=torch.randn(1,1,5,5)model=nn

HACKTHEBOX——Starting Point Tier1

目录AppointmentSequelCrocodileResponderIgnitionBikePennyworthTacticsAppointmenttask1 WhatdoestheacronymSQLstandfor?结构化查询语言(StructuredQueryLanguage)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相

消失点(灭点、Vanishing Point)

目录定义:性质:消失点分为3种 一条直线的消失点是过摄影中心且平行于该直线的直线与像平面的交点。地面物体的两个消失点的连线为水平线,提供地平线的信息应用:计算焦距和图像中心求像心求焦距 利用灭点恢复相机姿态,至少需要找到两个互相垂直方向上的灭点。最近在看Cube-SLAM和相机标定都看到了消失点,之前没了解过,花了些时间学习了下。定义:消失点:指的是 立体图形各条平行边的延伸线所产生的相交点。因为空间中的平行线经透视变换后均相较于一点。例如下图的轨道包含若干条平行线,在图像上交于一点。  空间中直线有多种表示方式,参考:(68条消息)空间直线的几种方程_空间直线方程_酷酷的Herio的博客-C

OpenAI 3D 模型生成器Point-E极速体验

OpenAI3D模型生成器Point-E极速体验3090显卡,极速体验三维模型生成,体验地址:Gradio文本生成图像的AI最近已经火到了圈外,不论是DALL-E2、DeepAI还是StableDiffusion,人人都在调用AI算法搞绘画艺术,研究对AI讲的「咒语」。不断进化的技术推动了文生图生态的蓬勃发展,甚至还催生出了独角兽创业公司StabilityAI。本周,OpenAI开源的3D模型生成器Point-E引发了AI圈的新一轮热潮,Point-E可以在单块NvidiaV100GPU上在一到两分钟内生成3D模型。相比之下,现有系统(如谷歌的DreamFusion)通常需要数小时和多块GPU

点击idea报异常, does not point to a valid JVM installation.

昨天斥巨资将近300刀买了一套正版的jetbrains,日常工作主要用pycharm,datagrip多一点,也装了idea,偶尔会写点java,突然一脸懵逼出来两个问题.1.点击图标报异常doesnotpointtoavalidJVMinstallationjava_home没有指向jvm,百度了一圈没解决,总结一下解决的方法.1.1检查JAVA_HOME首先还是先检查jdk是否配置正确,因为安装jdk时候,如果自定义了安装路径,后续若更新了,安装路径可能会变,导致配置的JAVA_HOME确实无效.我的jdk开始安装的8,还以为最新的idea版本不支持,于是换了11,确认过本地配置的JAVA

Deep Learning for 3D Point Clouds: A Survey

GuoY,WangH,HuQ,etal.Deeplearningfor3dpointclouds:Asurvey[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2020.之前组会要分享的一篇综述,太长了没读完,不知道啥时候能写完。。一、摘要最近,点云学习因其在计算机视觉、自动驾驶和机器人等许多领域的广泛应用而引起越来越多的关注。作为人工智能领域的主导技术,深度学习已成功用于解决各种二维视觉问题。然而,由于使用深度神经网络处理点云所面临的独特挑战,点云上的深度学习仍处于起步阶段。最近,点云上的深度学习甚至变得蓬勃发展,人们提

OpenAI文本生成3D模型再升级,数秒完成建模,比Point·E更好用

生成式AI大模型是OpenAI发力的重点,目前已经推出过文本生成图像模型DALL-E和DALL-E2,以及今年初基于文本生成3D模型的POINT-E。近日,OpenAI研究团队升级了3D生成模型,全新推出了Shap・E,它是一个用于合成3D资产的条件生成式模型。目前相关模型权重、推理代码和样本已开源。论文地址:https://arxiv.org/abs/2305.02463项目地址:https://github.com/openai/shap-e我们先来看一下生成效果。与根据文字生成图像类似,Shap・E生成的3D物体模型主打一个「天马行空」。例如,一个看起来像香蕉的飞机:看起来像一棵树的椅子

单通道说话人语音分离——Conv-TasNet(Convolutional Time-domain audio separation Network)

单通道说话人语音分离——Conv-TasNet模型(ConvolutionalTime-domainaudioseparationNetwork)参考文献:《Conv-TasNet:SurpassingIdealTime-FrequencyMagnitudeMaskingforSpeechSeparation》1.背景        在真实的声学环境中,鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性,人们已经提出了许多方法来解决这一问题。然而,语音分离的准确性,特别是对新演讲者,仍然不够。        大多数以前的语音分离方法都是在混合信号的时频(T-F,或谱图

【3D目标检测】Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud

目录概述整体流程伪点云vs点云2D-3D边界框的一致性约束概述本文的输入数据仅仅是单目图像,在方法上是融合了伪点云(Pseudo-LiDAR)的深度信息表示方法与FrustumPointNets的检测方法。乍一看文章和伪点云原论文Pseudo-LiDARfromVisualDepthEstimation:BridgingtheGapin3DObjectDetectionforAD一模一样,但是会更具体一点,也就是本文只关注单目图像,同时解决了一些伪点云存在的问题。ps:作者提到了其他设备的一些弊端:深度相机能捕捉的范围很有限;双目相机工作的流程很麻烦,需要校准与同步;激光雷达就不用说了,很贵哈

最远点采样(Farthest Point Sampling,FPS)算法详解

 最远点采样(FSP)是一种常用的采样算法,主要用于点云数据(如激光雷达点云数据、分子坐标等)的采样。一:算法原理 最远点采样的研究对象是点云数据,即一堆离散的坐标点。广义上其它许多样本数据类型也可以使用FPS算法并进行最远点采样,如我们经常使用的iris、drybeandataset等数据集的数据类型,这些数据可以把每一条看做p维空间中的一个点,并且也可以用各种距离度量方法计算各条数据之间的距离。兔兔在这里为了方便,只针对三维点云数据进行实例讲解。 FPS的核心思想是使得所有采样点之间的距离尽可能的远,也就是数据尽可能的离散均匀。例如对于数据(1,2,3,4,5,6,7,8,9),我们若需要