草庐IT

三个buff都不能让你成功getGEO吗

小洁忘了怎么分身 2023-10-20 原文

问题

学员遇到一个报错:

第一个buff:timeout设置

我一瞅,time out 啊。迅速发了一个链接,并告诉他要主动搜索。。。

核心解决方案是一句代码

options(timeout=100000)
getOption("timeout")
## [1] 1e+05

就是把下载时间60s的限制解除。之前用来解决一个类似的报错:

Timeout of 60 seconds was reached

反馈没用,报错不变。

第二个buff:加速

options( 'download.file.method.GEOquery' = 'libcurl' )

这个是设置用libcurl加快访问速度。加速完了还是慢,那有啥办法,憋着吧。

反馈没用,报错还是不变。

第三个buff:geoChina

既然是geo的芯片数据,那么曾老板的镜像怎么可以没有镜头。

#install.packages("AnnoProbe")
library(AnnoProbe)
a = geoChina("GSE148601",destdir = ".")

## Error in geoChina("GSE148601", destdir = "."): Your GSE may not be expression by array, or even not a GSE

反馈报错,说这不是一个芯片。

其实是因为这个数据太新,2022年9月的,比我儿子还小。

所以没有被AnnoProbe收录啊!别急别急,你看,他在搞了。

如果是一个被收录了的数据,他的打开方式是这样的:

b = geoChina("GSE42872",destdir = ".")
class(b[[1]])

## [1] "ExpressionSet"
## attr(,"package")
## [1] "Biobase"

然后就可以对接提取矩阵和临床信息的代码啦。

或者也可以使用tinyarray进一步简化

#install.packages("tinyarray")
library(tinyarray)
geo = geo_download("GSE42872",by_annopbrobe = T)
names(geo)

## [1] "exp" "pd"  "gpl"

一步到位拿到表达矩阵 临床信息 GPL编号哦。

第四个buff:改包!

既然前三个buff都不能解决,只能让神奇的小洁老师自己上手了。

一番搜索,发现是GEOquery更新过后,downloadFile这个函数做了改动。

2.62版本,它是这样

function (url, destfile, mode, quiet = TRUE) 
{
  h <- curl::new_handle()
  curl::handle_setheaders(h, `accept-encoding` = "gzip")
  result = tryCatch({
    curl::curl_download(url, destfile, mode = mode, quiet = quiet, 
      handle = h)
    return(TRUE)
  }, error = function(e) {
    message(e)
    return(FALSE)
  })
  message("File stored at:")
  message(destfile)
  if (!result) {
    if (file.exists(destfile)) {
      file.remove(destfile)
    }
    stop(sprintf("Failed to download %s!", destfile))
  }
  return(0)
}

2.66版本 它成了这样:

function (url, destfile, mode, quiet = TRUE) 
{
    h <- curl::new_handle()
    curl::handle_setheaders(h, `accept-encoding` = "gzip")
    timeout_seconds <- 120
    curl::handle_setopt(h, timeout_ms = timeout_seconds * 1000)
    result = tryCatch({
        curl::curl_download(url, destfile, mode = mode, quiet = quiet, 
            handle = h)
        return(TRUE)
    }, error = function(e) {
        message(e)
        return(FALSE)
    })
    message("File stored at:")
    message(destfile)
    if (!result) {
        if (file.exists(destfile)) {
            file.remove(destfile)
        }
        stop(sprintf("Failed to download %s!", destfile))
    }
    return(0)
}

简单来说就是timeout变成固定的120s了,这也就是为什么学员一开始的报错里出现了120000毫秒,换算过来就是120s。

so,解决办法是编辑R包。github上面已经有人提交了解决办法,但还没有被作者团队接纳。

从github下载这个包的zip,解压,找到R/getGEOfile.R,downloadFile函数,把第三句代码改掉

timeout_seconds <- max(getOption("timeout"), 120)

这样,timeout的设置就可以用起来了,。

devtools::install_local("GEOquery-master.zip")
library(GEOquery)
options(timeout=100000)
getOption("timeout")
options( 'download.file.method.GEOquery' = 'libcurl' )
a = getGEO("GSE148601",destdir = ".")

不报错啦!

https://github.com/seandavi/GEOquery/pull/139

第五个buff:想办法外部下载。

无非是网络限制而已,你可以想办法的。或者,把表达矩阵的链接复制下来,求助也是很快的。

image.png

点进去,右键复制链接

image.png

https://ftp.ncbi.nlm.nih.gov/geo/series/GSE148nnn/GSE148601/matrix/GSE148601_series_matrix.txt.gz

自己去浏览器下载,或者发出来求助,拿到文件后,放在工作目录下,代码就可以调用本地文件,而不去网页下载,这样就可以正常运行啦!

请注意,降低别人帮助你的门槛是很重要的,发链接别人可以直接下载,发编号别人却需要一下下搜索和点开哦。《为回答你的人着想一下》

有关三个buff都不能让你成功getGEO吗的更多相关文章

  1. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  2. ruby - 为什么不能使用类IO的实例方法noecho? - 2

    print"Enteryourpassword:"pass=STDIN.noecho(&:gets)puts"Yourpasswordis#{pass}!"输出:Enteryourpassword:input.rb:2:in`':undefinedmethod`noecho'for#>(NoMethodError) 最佳答案 一开始require'io/console'后来的Ruby1.9.3 关于ruby-为什么不能使用类IO的实例方法noecho?,我们在StackOverflow上

  3. ruby-on-rails - Ruby rand() 不能接受变量? - 2

    我对此有点困惑。我在RoR项目中的最终目标是从我的数据库中获取单个随机配置文件。我想它应该是这样的:@profile=Profile.find_by_user_id(rand(User.count))它一直抛出错误,因为user_id0不存在,所以我把它的一部分拿出来检查发生了什么:@r=rand(User.count)每次都返回0。发生什么了?我注册了5个假用户和5个相关配置文件来测试这个。如果我将Profile.find_by_user_id(rand(User.count))重写为Profile.find_by_user_id(3)它工作得很好。User.count也在工作。所以

  4. ruby - 为什么我不能从 ruby​​ 中的选定键创建新的散列? - 2

    这个问题困扰了我一段时间。这不是一件困难的事情,但我不知道为什么没有简单的方法来做到这一点,我敢打赌有但我没有看到。我只想取一个散列,像这样:cars={:bob=>'Pontiac',:fred=>'Chrysler',:lisa=>'Cadillac',:mary=>'Jaguar'}然后做类似的事情cars[:bob,:lisa]得到{:bob=>'Pontiac',:lisa=>'Cadillac'}我这样做了,效果很好:classHashdefpick(*keys)Hash[select{|k,v|keys.include?(k)}]endendruby-1.8.7-p249

  5. ruby-on-rails - 为什么 Rails 可以使用 `if` 作为哈希键但在 Ruby 中不能 - 2

    在纯Rubyirb中,不能输入{if:1}。该语句不会终止,因为irb认为if不是符号,而是if语句的开始。那么为什么Rails可以有before_filter接受if作为参数?该指南的代码如下:classOrderunless也会发生同样的事情。 最佳答案 这是一个irb问题,而不是Ruby。bash=>ruby-e"puts({if:1})"bash=#{:if=>1}您可以改用pry。它将正确读取输入。https://github.com/pry/pry 关于ruby-on-rai

  6. ruby - 不能将 `each` 的所有或大多数情况替换为 `map` 吗? - 2

    Enumerable#each和Enumerable#map的区别在于返回的是接收者还是映射后的结果。回到接收者是微不足道的,你通常不需要在each之后继续一个方法链,比如each{...}.another_method(我可能没见过这样的案例。即使你想回到接收者那里,你也可以通过tap来实现)。所以我认为所有或者大部分使用Enumerable#each的情况都可以用Enumerable#map代替。我错了吗?如果我是对的,each的目的是什么?map是否比each慢?编辑:我知道当您对返回值不感兴趣时​​使用each是一种常见的做法。我对这种做法是否存在不感兴趣,但感兴趣的是,除了从

  7. ruby - 为什么我不能将一个 fixnum 除以另一个 fixnum? - 2

    我目前正在尝试将包含数字82,000的散列counts["email"]除以包含值130万的变量total。当我运行putscounts["email"]/total时,我得到0。为什么我不能对这些进行除法? 最佳答案 您正在执行除法,尽管不是您预期的那样。在Ruby中有许多不同的整数除法:#Integerdivision:5/4#=>1#Floatingpointdivision:5.fdiv(4)#=>1.25#Rationaldivision:5.quo(4)#=>Rational(5,4)您还可以将其中一个整数转换为Floa

  8. ruby - 在 Ruby 中,如果我们定义了一个方法调用 "c=",为什么 c = 3 不能调用它? - 2

    例如,如果我们defc=(foo)p"hello"endc=3c=(3)并且不会打印“hello”。我知道它可以被self.c=3调用,但为什么呢?可以通过哪些其他方式调用它? 最佳答案 c=3(和c=(3),完全等同于它)总是被解释为局部变量赋值。你可能会说只有当方法c=没有在self上定义时,它才应该被解释为局部变量赋值,但是这有很多问题:至少MRI需要在解析时知道在给定范围内定义了哪些局部变量。但是,在解析时并不知道给定的方法是否已定义。所以ruby​​直到运行时才知道c=3是否定义了变量c或者调用了方法c=,这意味着它不会知

  9. ruby-on-rails - 为什么不能使用符号而不是字符串来访问 Rails 模型属性? - 2

    我需要在数据库更新前后比较一些Rails(2.3.11)模型属性值,因此我首先查找我的记录并将现有属性值保存在哈希中,如下所示:id=params[:id]work_effort=WorkEffort.find(id)ancestor_rollup_fields={:scheduled_completion_date=>work_effort.scheduled_completion_date}work_effort.update_attributes(params.except(:controller,:action))#etcetera请注意,我坚持使用符号作为哈希键的“最佳实践”

  10. ruby-on-rails - 为什么我不能在 Rails 的表格中创建一个数组作为列? - 2

    为什么我不能这样做:classCreateModels是否有其他方法可以使数组(“apples”)成为Fruit类实例的属性? 最佳答案 在Rails4中并使用PostgreSQL,您实际上可以在数据库中使用数组类型:迁移:classCreateSomething 关于ruby-on-rails-为什么我不能在Rails的表格中创建一个数组作为列?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/qu

随机推荐