cross-language

汇编语言（Assembly Language）习题：键盘输入一个字符串，试将其中的小写字母转换为大写字母，其它字符保持不变。

1.题目：键盘输入一个字符串，试将其中的小写字母转换为大写字母，其它字符保持不变。前置知识：汇编语言常用系统功能调用（如果懂直接跳过看题目详解）1．单字符输入（1号调用）格式：MOV AH，1　INT 21H功能：从键盘输入字符的ASCII码送入寄存器AL中，并送显示器显示。2．单字符显示（2号调用）格式：MOVDL，待显示字符的ASCII码　MOVAH，2　INT21H功能：将DL寄存器中的字符送显示器显示，如果DL中为〈CTRL〉+〈BREAK〉的ASCII码，则退出。3．打印输出（5号调用）格式：MOV DL，待打印字符的ASCII码　MOV AH，5　INT 21H功能：将DL寄存器中

论文笔记--Fly-Swat or Cannon? Cost-Effective Language Model Choice via Meta-Modeling

论文笔记--Fly-SwatorCannon?Cost-EffectiveLanguageModelChoiceviaMeta-Modeling1.文章简介2.文章概括3文章重点技术3.1问题陈述3.2框架3.2.1MetaModel&Costestimation3.2.2AssignmentStrategies4.文章亮点5.原文传送门6.References1.文章简介标题：Fly-SwatorCannon?Cost-EffectiveLanguageModelChoiceviaMeta-Modeling作者：MarijaŠakota,MaximePeyrard,RobertWest日期：

【论文阅读笔记】Medical Vision Language Pretraining: A survey

arXiv:2312.06224Submitted11December,2023;originallyannouncedDecember2023.这篇综述文章很长，本文对各部分简要概述。【文章整体概述】医学视觉语言预训练（VLP）最近已经成为解决医学领域标记数据稀缺问题的一种有希望的解决方案。通过利用成对或非成对的视觉和文本数据集进行自监督学习，模型能够获得大量知识并学习强大的特征表示。这样的预训练模型有潜力同时提升多个下游医学任务，减少对标记数据的依赖。然而，尽管近期取得了进展并显示出潜力，目前还没有一篇综述文章全面探讨了医学VLP的各个方面和进展。在本文中，特别审视了现有工作，通过不同的预

Video-LLaMA An Instruction-tuned Audio-Visual Language Model for Video Understanding 用于视频理解的指令调谐视听语言

1.摘要我们提出了一个多模态框架Video-LLaMA1，它使大型语言模型(LLM)能够理解视频中的视觉和听觉内容。视频-来自冻结的预训练视频和音频编码器和冻结的LLM的美洲驼引导跨模式训练。不像以前的工作，补充线性最小二乘法只处理视觉或听觉信号(朱等，2023；刘等，2023；Huangetal.，2023a)，Video-LLaMA通过解决两个挑战来实现视频理解:(1)捕捉视觉场景的时间变化，(2)整合视听信号。为了应对第一个挑战，我们提出了一个视频Q-former来将预训练的图像编码器组装到我们的视频编码器中，并引入视频到文本生成任务来学习视频语言的对应性。对于第二个挑战，我们利用Ima

【论文阅读：VisionLAN（ICCV2021）】From Two to One: A New Scene Text Recognizer with Visual Language Modeling

VisionLAN摘要介绍相关工作场景文本识别掩蔽和预测该方法Pipeline屏蔽语言感知模块(MLM模块)视觉推理模块（VRM）训练目标实验数据集实验细节消融实验与先进算法的对比OST数据集上的语言能力中文长数据集的泛化能力定性分析总结运行摘要该论文提出了一种视觉语言建模网络（VisionLAN），它将视觉和语言信息作为一个整体，直接直接赋予视觉模型语言的能力。在训练阶段引入了基于字符的遮挡特征图的文本识别，视觉模型在视觉线索被混淆时（遮挡、噪声等），利用字符的视觉纹理，还利用视觉语境的语言信息进行识别。由于语言信息与视觉特征一起获取，不需要额外的语言模型，因此VisionLAN的速度提高了

What the DAAM: Interpreting Stable Diffusion Using Cross Attention

WhattheDAAM:InterpretingStableDiffusionUsingCrossAttention(Paperreading)RaphaelTang,ComcastAppliedAI,ACL2023bestpaper,Code,Paper1.前言大规模扩散神经网络是文本到图像生成中的一个重要里程碑，但人们对其了解甚少，缺乏可解释性分析。在本文中，我们对最近开源的模型StableDiffusion进行了文本-图像归因分析。为了生成像素级归因图，我们在去噪子网络中提升并聚合交叉注意词-像素得分，将我们的方法命名为DAAM。我们通过测试其对名词的语义分割能力以及对所有词性的广义归因

跨模态检索论文阅读：Improving Cross-Modal Retrieval With Set of Diverse Embeddings利用多样嵌入集提高跨模态检索

摘要跨图像和文本模态的跨模态检索由于其固有的模糊性而成为一项具有挑战性的任务：图像通常表现出各种情况，并且字幕可以与不同的图像相结合。基于集合的嵌入已经被研究作为这个问题的解决方案。它试图将样本编码为一组不同的嵌入向量，这些嵌入向量捕获样本的不同语义。本文提出了一种新的基于集合的嵌入方法，该方法在两个方面与以往的工作有所不同。首先，我们提出了一种新的相似性函数，称为光滑切角相似性，该函数旨在减轻现有相似性函数对基于集嵌入的副作用。其次，我们提出了一个新的集合预测模块来生成一组嵌入向量，该向量通过槽注意机制有效地捕捉输入的不同语义。我们的方法在不同视觉主干的COCO和Flickr30K数据集上进

【论文笔记】A Survey of Large Language Models in Medicine - Progress, Application, and Challenges

ASurveyofLargeLanguageModelsinMedicine:Progress,Application,andChallenge文章主要内容将LLMs应用于医学，以协助医生和病人护理，成为人工智能和临床医学领域的一个有前景的研究方向。为此，本综述提供了医学中LLMs当前进展、应用和面临挑战的全面概述。具体来说，旨在回答以下问题：1）什么是LLMs，如何构建医学LLMs？2）医学LLMs的下游表现如何？3）如何在实际临床实践中使用医学LLMs？4）使用医学LLMs会带来哪些挑战？5）我们如何更好地构建和利用医学LLMs？因此，本综述旨在提供医学中LLMs的机遇和挑战的洞见，并作为

android - 开始 Android 开发 : Native or cross-platform?

我是一名经验丰富的专业程序员，想深入研究Android编程。我还希望使用PhoneGap或Titanium等工具研究跨平台编程。但是，我有点怀疑哪种学习策略最好。一种方法是先熟悉Android环境，然后再探索跨平台工具的可能性。另一种方法是开始使用Titanium(在我看来，这是上述两种方法中更好的选择)，然后在一段时间后研究底层的Android构建block。这种方法似乎值得考虑的原因是，尽管我以编程为生20年，但我对Java没有任何经验。完成某件事的感觉一直鼓舞着我。你怎么看？选项2是否有意义，或者首先了解Android环境是否更明智？提前致谢，马丁最

android - 将新版本的应用上传到 Google Play，开发者控制台显示 "69 languages added"

当我看到这个时，我正在上传我的应用程序的新版本:我肯定没有添加所有这些语言。它们不在也从来不在我的values-xx文件夹中，而strings.xml所在的文件夹。我已尝试检查APK，但字符串资源不存在，我认为它们都被编译到一个文件中。这是PlayDeveloperConsole的新功能，还是我的应用程序中的错误？我应该发布还是不发布？最佳答案发生这种情况是因为您的应用包含Android支持库、GooglePlay服务或其他库，它们为所有这些语言提供字符串。您可以在此状态下发布应用，但对于您未明确支持的语言，用户可能会在某些地方