源阅读

论文阅读 - Natural Language is All a Graph Needs

目录摘要IntroductionRelatedWork3InstructGLM3.1Preliminary3.2InstructionPromptDesign3.3节点分类的生成指令调整3.4辅助自监督链路预测4Experiments4.1ExperimentalSetup4.2MainResults4.2.1ogbn-arxiv 4.2.2Cora&PubMed4.3AblationStudy4.4InstructionTuningatLowLabelRatio 5FutureWork论文链接：https://arxiv.org/pdf/2308.07134.pdf摘要 Cha

经典文献阅读之--Online Monocular Lane Mapping(使用Catmull-Rom样条曲线完成在线单目车道建图)

0.简介对于单目摄像头完成SLAM建图这类操作，对于自动驾驶行业非常重要，《OnlineMonocularLaneMappingUsingCatmull-RomSpline》介绍了一种仅依靠单个摄像头和里程计生成基于样条的在线单目车道建图方法。我们提出的技术将车道关联过程建模为一个二分图的分配问题，并通过结合Chamfer距离、姿态不确定性和横向序列一致性为边赋予权重。此外，文中还精心设计了控制点初始化、样条参数化和优化，以逐步创建、扩展和精化样条。相关的代码已经在Github上开源了。1.主要贡献基于Catmull-Rom样条表示，设计了一个完整的在线车道建图系统，如图1所示。所提出的系统允

车道 Catmull-Rom span class style 机器学习人工智能

[论文阅读]YOLO9000：Better，Faster，Stronger

摘要我们引入了YOLO9000，一个可以检测超过9000种类别的先进的实时目标检测系统。首先我们提出了多种yolo检测方法的提升方式，既新颖又参考了之前的工作。改进后的模型，YOLOV2在标准检测任务例如PASCALVO和COCO上都取得了领先。使用一个新颖的多尺度的训练方法，同一个YOLOV2模型可以在不同尺寸下行，提供了一种速度和准确率之间的简单的平衡。在67fps下，yolov2在VOC2007上取得了78.6的mAP，在40fps下，yolov2取得了78.6的mAP,在超越现有的最先进的方法例如使用了ResNet的FasterR-CNN和SSD的同时运行速度显著的快。最后我们提出了一

Stronger Better span class style 论文阅读目标跟踪人工智能

2024年 30篇神经架构搜索(Neural Architecture Search) ICLR(Under review) 阅读笔记

目录1. AnytimeNeuralArchitectureSearchOnTabuLarData(6663)2. Archlock:LockingDNNTransferabilityAtTheArchitectureLevelWithAZero-CostBi-NaryPredictor(683) 3.ComposingRecurrentSpikingNeuralNetworksUsingLocally-RecurrentMotifsAndRisk-MitigatingArchitecturalOptimization(6555)4.CurriculumReinforcementLearni

Architecture 架构 strong xff xff0c 笔记人工智能

经典文献阅读之--VoxFormer(基于Transformer的3D语义场景补全)

0.简介之前了解了很多BEV的相关操作，但是基本上要么是激光和视觉结合，要么是纯视觉完成的2D激光投影这两种，而那种3DOccupancy方法可以利用栅格的方法完成纯视觉占据栅格的生成。《VoxFormer:SparseVoxelTransformerforCamera-based3DSemanticSceneCompletion》就是这种方法对于被遮挡的物体和场景，人们可以很容易地联想出其完整的3D几何结构，这种吸引人的能力对于AI系统来说是一个至关重要的。为了应对这种挑战，语义场景补全（SSC）任务应运而生，以往的SSC通常以3D点云作为输入，或以密集特征投影将2D图像作为输入来得到3D语

语义 Transformer span class style 3d 深度学习

论文阅读 Attention is all u need - transformer

文章目录1摘要1.1核心2模型架构2.1概览2.2理解encoder-decoder架构2.2.1对比seq2seq，RNN2.2.2我的理解3.Sublayer3.1多头注意力multi-headself-attention3.1.1缩放点乘注意力ScaledDot-ProductAttention3.1.2QKV3.1.3multi-head3.1.4masked3.2线性层MLP3.3embeddingandsoftmax3.4positionalencoding3.5dropout总结附[李沐b站对该论文理解的一些题目和答案](https://zhuanlan.zhihu.com/p/

transformer Attention xff xff0c xff0 论文阅读深度学习

ios - Github 上的 OBDII 蓝牙阅读器 iOS 应用程序？

我目前正在开发一个可以通过蓝牙与OBDII加密狗连接的iOS项目。有谁知道我可以学习的任何github项目？看来OBD上iOS开发的资源不多。最佳答案尝试在github上搜索如下查询以获得ios和iphone的OBD2结果。https://github.com/search?utf8=%E2%9C%93&q=obd2+ioshttps://github.com/search?utf8=%E2%9C%93&q=obd2+iphone&type=Repositories&ref=searchresults希望对你有帮助。

阅读器 Github section https ios iphone bluetooth obd-ii

【论文阅读笔记】医学多模态新数据集-Large-scale Long-tailed Disease Diagnosis on Radiology Images

这是上海交通大学2023.12.28开放出来的数据集和论文，感觉很宝藏，稍微将阅读过程记录一下。ZhengQ,ZhaoW,WuC,etal.Large-scaleLong-tailedDiseaseDiagnosisonRadiologyImages[J].arXivpreprintarXiv:2312.16151,2023.项目主页：https://qiaoyu-zheng.github.io/RP3D-Diag/代码：https://github.com/qiaoyu-zheng/RP3D-Diag数据集：https://huggingface.co/datasets/QiaoyuZhen

模态 Large-scale xff0c xff xff0 论文阅读笔记

Comprehensive Regularization in a Bi-directional Predictive Network for Video Anomaly Detection 论文阅读

ComprehensiveRegularizationinaBi-directionalPredictiveNetworkforVideoAnomalyDetection论文阅读AbstractIntroductionRelatedWorkMethodologyExperimentsConclusion阅读总结论文标题：ComprehensiveRegularizationinaBi-directionalPredictiveNetworkforVideoAnomalyDetection文章信息：发表于：AAAI（CCFA）原文链接：https://ojs.aaai.org/index.php

Bi-directional Regularization span class style 论文阅读视觉检测深度学习论文 python

【论文阅读】MCANet: Medical Image Segmentation with Multi-Scale Cross-Axis Attention

文章目录摘要创新点总结实现效果总结摘要链接：https://arxiv.org/abs/2312.08866医学图像分割是医学图像处理和计算机视觉领域的关键挑战之一。由于病变区域或器官的大小和形状各异，有效地捕捉多尺度信息和建立像素间的长距离依赖性至关重要。本文提出了一种基于高效轴向注意力的多尺度交叉轴注意（MCA）方法来解决这些问题。MCA通过计算两个并行轴向注意力之间的双向交叉注意力，以更好地捕获全局信息。此外，为了处理病变区域或器官在个体大小和形状上的显著变化，我们还在每个轴向注意力路径中使用不同大小的条形卷积核进行多次卷积，以提高编码空间信息的效率。我们将提出的MCA构建在MSCAN主

Segmentation Multi-Scale xff0c xff0 xff 论文阅读

45 46 474849 50 51