数据集 开放访问

BIP4Covid19:冠状病毒相关出版物的影响指标和指标

thanasis vergoulis.; Ilias Kanellos.; Serafeim Chatzopoulos.; 达娜埃普·卡里迪; Theodore Dalamagas.

此数据集包含与其相关的一组出版物的影响指标和指标 covid-19传染病 和导致它的冠状病毒。它基于:

  1. Τhe CORD-19数据集 由团队发布 语义学者1 and
  2. Τ他策划了数据提供的数据 Litcovid Hub.2.

这些数据已被清除并与数据集成 Covid-19-Tweetids 来自其他来源(例如,PMC)。结果是数据集 276,739个独特的文章以及相关元数据(例如,底层引文网络)。我们利用此数据集进行生产,为每篇文章进行以下影响措施的值:

  • 影响: 基于引文的措施,反映了文章的总影响。这是基于PageRank3 网络分析方法。在引文网络的背景下,它估计每篇文章的重要性基于整个网络的中心。使用PaperRanking计算该措施(//github.com/diwis/PaperRanking) 图书馆4.
  • 影响力: 基于引文的措施,反映了文章的总影响。这是每篇文章的引文计数,基于BIP4Covid19数据集中包含的文章之间的引文网络计算。
  • 人气: 基于引文的措施,反映了物品的当前影响。这是基于attrank5 引文网络分析方法。像PageRank这样的方法是针对最近发表的文章而偏见的(新文章需要时间接受他们的第一个引用)。 Attrank减轻了包含基于注意的机制的这个问题,类似于优惠附件的时间限制版本,明确捕获研究人员'偏好读取最近接受了很多关注的论文。这就是为什么它更适合捕获当前"hype" of an article.
  • 人气替代方案: 反映物品当前影响的基于引文的措施(这是BIP4Covid19提供的基本普及,直到版本26)。这是基于RAM6 引文网络分析方法。像PageRank这样的方法是针对最近发表的文章而偏见的(新文章需要时间接受他们的第一个引用)。 RAM使用已知的方法来减轻这个问题"time-awareness"。这就是为什么它更适合捕获当前"hype"文章。使用PaperRanking计算该措施(//github.com/diwis/PaperRanking) 图书馆4.
  • 社交媒体关注: 与本文相关的推文数量。从中收集相关数据 Covid-19-Tweetids 数据集。在此版本中,已从上一个数据集中考虑了6 / 2/21-12 / 2/21之间的推文。  

我们提供五个CSV文件,所有包含相同的信息,但每个都会通过不同的影响措施订购其条目。所有CSV文件都是分隔的,并且具有相同的列(PubMed_ID,PMC_ID,DOI,ChecomeSt_score,Pockority_alt_score,人气分数,影响_ALT分数,推文计数)。

该工作基于以下出版物:

  1. 新冠肺炎 Open Research Dataset (CORD-19). 2020. Version 2021-03-21 Retrieved from //pages.semanticscholar.org/coronavirus-research. Accessed 2021-03-28. doi:10.5281/zenodo.3715506
  2. 陈Q,换一个,&Lu Z.(2020)跟上最新的冠状病毒研究,自然579:193(版本2021-03-28)
  3. R. Motwani L. Page,S. Brin和Winograd。 1999. PageRank引文排名:将订单带到网络上。技术报告。斯坦福州inforbab。
  4. I. Kanellos,T.Vergoulis,D.Sacharidis,T. Dalamagas,Y.Vassiliou:基于影响的科学出版物排名:调查和实验评估。 TKDE 2019.
  5. I. Kanellos,T.Vergoulis,D. Sacharidis,T. Dalamagas,Y.Vassiliou:通过短期科学影响排名论文。 Corr Abs / 2006.00951(2020)
  6. Rumi Ghosh,Tsung-Ting Kuo,Chun-Nan Hsu,Shou-de Lin和Kristina Lerman。 2011.动态引文网络中的时间感知排名。在数据挖掘研讨会(ICDMW)中。 373.–380

可以找到使用这些数据来促进Covid-19文献​​探索的Web用户界面 这里。在我们的预印刷品中有更多细节 这里.

资金:我们承认该项目的支持"从大数据管理转移到数据科学"(MIS 5002437/3)在该行动下实施"加强研究与创新基础设施",由业务计划资助"竞争力,创业和创新"(NSRF 2014-2020)并由希腊和欧盟(欧洲区域发展基金)共同资助。

使用条款: 提供了这些数据"as is",没有任何愿望。该数据是根据Creative Commons归因4.0国际许可提供的。

Please cite: Thanasis Vergoulis, Ilias Kanellos, Serafeim Chatzopoulos., Danae Pla Karidi, Theodore Dalamagas. "BIP4COVID19: Releasing impact measures for articles relevant to COVID-19". bioRxiv 2020.04.11.037093; doi: //doi.org/10.1101/2020.04.11.037093
Files (123.2 MB)
姓名 尺寸
articles_by_influence.csv.
MD5:3A5D7920BCF72A05BAB21ED060B84E59.
24.6 MB. Download
asticles_by_influence_alt.csv.
MD5:7CCD966797C3C270DA88C0122D7F762B.
24.6 MB. Download
articles_by_popularity.csv.
MD5:361F5754BD0609E3672C24A522ED8DC1
24.6 MB. Download
articles_by_popularity_alt.csv.
MD5:76ab044d2c916a23543cbc1e5fd46a0f
24.6 MB. Download
asticles_by_tweets.csv.
MD5:66EE6A594C8C72D38E6CBB81A58CFA9e
24.6 MB. Download
  • 新冠肺炎 Open Research Dataset (CORD-19). 2020. Version 2021-03-28. Retrieved from //pages.semanticscholar.org/coronavirus-research. Accessed 2021-03-28.

  • I. Kanellos,T.Vergoulis,D.Sacharidis,T. Dalamagas,Y.Vassiliou:基于影响的科学出版物排名:调查和实验评估。 TKDE 2019.

  • I. Kanellos,T.Vergoulis,D. Sacharidis,T. Dalamagas,Y.Vassiliou:通过短期科学影响排名论文。 Corr Abs / 2006.00951(2020)

  • Rumi Ghosh,Tsung-Ting Kuo,Chun-Nan Hsu,Shou-de Lin和Kristina Lerman。 2011.动态引文网络中的时间感知排名。在数据挖掘研讨会(ICDMW)中。 373.–380

  • R. Motwani L. Page,S. Brin和Winograd。 1999. PageRank引文排名:将订单带到网络上。技术报告。斯坦福州inforbab。

  • 陈Q,换一个,&Lu Z.(2020)跟上最新的冠状病毒研究,自然579:193(版本2021-03-28)

106,418
11,962
views
downloads
所有版本 这个版本
意见 106,4180
下载 11,9620
数据量 139.2 GB.0字节
独特的观点 100,0870
独特的下载 8,7410

分享

引用