孟德

自编R语言小程序助力孟德尔随机化(Mendelian Randomization)数据挖掘

咱们再前两期已经对孟德尔随机化进行了一个初步的介绍，孟德尔随机化步骤相对简单固定，一共就是3步，但是如果我们一个一个的对研究变量和结果数据进行筛选，也是挺费时间的，我随手写了一个R的小程序可以帮助咱们进行数据挖掘。其实就是一个很简单的小程序，主要是对孟德尔随机化的步骤进行了打包，利用双循环对研究变量和结果变量进行匹配。函数体为Mendelian.help(exposure,outcome)Exposure就是我们的研究变量，outcome就是我们的结果变量。假设我们研究的想研究的原因变量有两个"ieu-a-22",“prot-b-66”，想研究的结局变量有3个"finn-b-O15_MEMBR

孟德尔孟德 span xff0c class r语言小程序开发语言

复现一篇16分的孟德尔随机化文章

今天我们来复现一篇16分左右的使用了孟德尔随机化方法的文章，文章的题目是：AmultivariableMendelianrandomizationanalysisinvestigatingsmokingandalcoholconsumptioninoralandoropharyngealcancer(研究口腔癌和口咽癌吸烟和饮酒的多变量孟德尔随机化分析)这是一篇老外的文章，咱们试着复现一下文章的数据和图表，和上一篇一样，作者和上一篇一样也是给咱们提供了详尽的数据和R的代码，我们可以跟着作者的思路进行一个复盘。作者研究的是吸烟和喝酒对口腔癌症的影响，作者指出，吸烟和饮酒对头颈癌的独立影响尚不清楚

孟德尔孟德 span class token r语言孟德尔随机化

R语言forestploter包优雅的绘制孟德尔随机化研究森林图

在既往文章中，我们对孟德尔随机化研究做了一个简单的介绍。我们可以发现，使用TwoSampleMR包做出来的森林图并不是很美观。今天我们使用R语言forestploter包优雅的绘制孟德尔随机化研究森林图。使用TwoSampleMR包做出来的森林图是这样的而很多SCI文章中的森林图是这样的我们今天来做个上图这样的森林图，使用的是《R语言复现一篇6分的孟德尔随机化文章》的数据，这篇文章作者直接提供了数据，所以我就直接拿来用了。作者分析了很多精神病和骨密度的结果，这里我就取精神分裂症和骨密度结果来分析我们构造森林图的大概格式如下，所以我们要按下图构造数据表格这一步只能手工做，没什么好办法，不过也没花

孟德尔孟德 span class token r语言

用UKBB数据库做孟德尔随机化之前要做的事情

用UKBB数据库做孟德尔随机化之前要做的事情点进来看的人都知道利用UKBB数据库做MR研究，不像GWAS数据库那么丝滑首先，这是一个巨无霸文件，压缩的就3+G，解压以后更是到了10+G。对了，给文件解压也是个问题。因为UKBB数据库下载来的是.bgz格式的压缩文件。要问有没有针对这种文件的解压软件，答案是有，但是懒得用。要是非得用，上链接↓https://fileinfo.com/extension/bgz懒的用的原因也很简单：不想把时间浪费在探索是否免费，软件多大，含不含广告之类之类的事情上，况且不用也能解决问题，还解决的很好。解决方案：1.重命名文件，把.bgz改成.gz这个方法在Wind

孟德尔孟德 xff0c xff0 xff 数据库

R数据分析：孟德尔随机化实操

好多同学询问孟德尔随机化的问题，我再来尝试着梳理一遍，希望对大家有所帮助，首先看下图1分钟，盯着看将下图印在脑海中：上图是工具变量（不知道工具变量请翻之前的文章）的模式图，明确一个点：我们做孟德尔的时候感兴趣的是x和y的关系，也就是小b，但是我们直接去跑x对y的回归肯定是不对的，因为有很多的U，因此我们借助工具变量G（关于工具变量我们之前的文章有详细的解释，请自行查阅），去估计我们感兴趣的小b。现在有天然良好的工具变量G，也就是我们的基因变量，此时有上面的图，再次重申：我们感兴趣的，最终希望得到准确估计的值是小b，按照上图我们应该有GY的关系是ab，GX的关系是a，于是乎b可以写成ab/a，就

孟德尔孟德 xff xff0c xff0 r语言数据分析 python

R语言复现一篇6分的孟德尔随机化文章

上一期我们对孟德尔随机化做了一个简单的介绍，今天我们来复现一篇6分左右的使用了孟德尔随机化方法的文章，文章的题目是：Mendelianrandomizationanalysisdoesnotrevealacausalinfluenceofmentaldiseasesonosteoporosis（孟德尔随机分析没有揭示精神疾病对骨质疏松症的因果影响）这是一篇我们国人写的文章，为什么选这篇文章呢？因为作者提供了文章的数据和主要流程的代码。我们可以跟着作者的思路进行一个复盘。作者的研究是精神病（包括精神分裂症(SCH)、抑郁症(MDD)、情绪障碍、人格分裂和其他相关疾病）会不会对骨质疏松或骨折造成的

孟德尔孟德 span class token r语言开发语言

【R包安装】TwoSampleMR 两样本孟德尔随机化

在Linux中安装R包TwoSampleMR用devtools直接安装报错解决办法用devtools直接安装报错library(devtools)devtools::install_github("MRCIEU/TwoSampleMR")#configure:error:Headerfilegmp.hnotfound;maybeuse--with-gmp-include=INCLUDE_PATH#ERROR:configurationfailedforpackage‘gmp’#*removing‘/public/home/wx2022/miniconda3/envs/MR_r4.1.2/lib

孟德尔孟德 span class token r语言 linux

复现一篇高分(IF = 11.274)孟德尔随机化分析文章-day3

话不多说，直接上代码library(TwoSampleMR)library(data.table)#step1.readexposuredataexposure_dat0.05,thenchooseInversevarianceweighted(fixedeffects)methodmr_results_het部分结果展示step5.所有SNP的F-stat值都大于10，因此都纳入分析中step5结果展示step6.异质性检测结果p=0.3858222>0.05，因此选择Inversevarianceweighted(fixedeffects)method；如果pstep6结果展示step7.

孟德尔孟德 section exposure dat

python - 罗莎琳德:孟德尔第一定律

我正尝试在http://rosalind.info/problems/iprb/解决问题Given:Threepositiveintegersk,m,andn,representingapopulationcontainingk+m+norganisms:kindividualsarehomozygousdominantforafactor,mareheterozygous,andnarehomozygousrecessive.Return:Theprobabilitythattworandomlyselectedmatingorganismswillproduceanindividu

罗莎琳德 python code section 等位 probability bioinformatics rosalind