目录
Detecting novel associations in large data sets
对本文的总体评价为:分
可参考以下标准:
- 5分:佳作、开创性成果
- 4分:合格的优秀论文、可直接接收发表
- 3分:小改(Minor)后可接收
- 2分:需要大改(Major)
- 1分:价值有限,即使修改后亦不能发表
- 0分:本wiki不收录0分的论文。。。
有必要时,可以在文中任何地方插入你的签名。
文献基本信息
标题
Detecting novel associations in large data sets
作者
- Reshef, David N., Yakir A. Reshef, Hilary K. Finucane, Sharon R. Grossman, Gilean McVean, Peter J. Turnbaugh, Eric S. Lander, Michael Mitzenmacher, and Pardis C. Sabeti
出版年份
2011
来源
Science
关键词
摘要
Identifying interesting relationships between pairs of variables in large data sets is increasingly important. Here, we present a measure of dependence for two-variable relationships: the maximal information coefficient (MIC). MIC captures a wide range of associations both functional and not, and for functional relationships provides a score that roughly equals the coefficient of determination (R2) of the data relative to the regression function. MIC belongs to a larger class of maximal information-based nonparametric exploration (MINE) statistics for identifying and classifying relationships. We apply MIC and MINE to data sets in global health, gene expression, major-league baseball, and the human gut microbiota and identify known and novel relationships.
引用方式
建议使用Google Scholar中的Chicago版式,例如:
Reshef, David N., Yakir A. Reshef, Hilary K. Finucane, Sharon R. Grossman, Gilean McVean, Peter J. Turnbaugh, Eric S. Lander, Michael Mitzenmacher, and Pardis C. Sabeti. “Detecting novel associations in large data sets.” science 334, no. 6062 (2011): 1518-1524.
链接
评阅意见
文献简介
1. 论文是关于什么的?[请提供该论文的简要摘要。]
文献评价
2. 这篇论文的长处和短处是什么?[请以以下角度评述:(a)创新(研究问题、建模、方法等);(b)相关性(研究问题、发现等);(c)严谨性(适当的方法、分析的正确性等)]
创新性
研究问题、建模、方法等
相关性
研究问题、发现
严谨性
适当的方法、分析的正确性等
需改改进之处
3.如果有的话,潜在改进的主要地方是什么?[如果这些关键要求和建议能够被适当处理,请重点关注能使文章发表的关键要求和建议。如果你看到不可逾越的障碍,请清楚地描述你的担忧。如果能为编辑和作者提供具体有建设性的意见最好不过了,并在可能的情况下,提出可行的建议。同样,应避免含糊不清和/或含糊不清的批评。]
需要小改的地方
4.如果有的话,潜在改进的微小地方是什么?[再次,请具体说明。]
进一步研究的可能与方向
5.有没有机会做一项新的研究?