我正在尝试从GEO db下载所有有关实验的条目,这些条目涉及“乳腺癌细胞系时间序列基因表达谱”。我使用的是GEOquery R包,提交的查询如下:
> sql <- paste("SELECT DISTINCT gse.title,gse.gse", "FROM",
" gsm JOIN gse_gsm ON gsm.gsm=gse_gsm.gsm",
" JOIN gse ON gse_gsm.gse=gse.gse",
" JOIN gse_gpl ON gse_gpl.gse=gse.gse",
" JOIN gpl ON gse_gpl.gpl=gpl.gpl", "WHERE",
" gsm.molecule_ch1 like '%total RNA%' AND",
" gse.title LIKE '%breast cancer cell lines time series gene expression profiles%' AND",
" gpl.organism LIKE '%Homo sapiens%'", sep = " ")
>rs <- dbGetQuery(con, sql)现在,输出是1个数据集。这似乎太少了,所以是错误的,因为我们肯定知道已经在乳腺癌细胞系上进行了大量的时间序列实验。我想,我在sql查询中可能在"title“中犯了一个错误。有谁可以帮我?
发布于 2012-07-04 11:54:32
查询查找子字符串breast cancer cell lines time series gene expression profiles:单词必须完全按照这个顺序出现,中间不能有任何东西。例如,您可以尝试拆分它(您可能需要进一步拆分):
gse.title LIKE '%breast cancer cell lines%'
AND gse.title LIKE '%time series%'
AND gse.title LIKE '%gene expression profiles%'对于某些数据库,LIKE是区分大小写的:在这种情况下,ILIKE可能更可取。
https://stackoverflow.com/questions/11314787
复制相似问题