2022-11-09から1日間の記事一覧

文献整理2022 season 5 (7) PubMed書誌データをscrapeする

1年分ごとにfetchしたデータはそれぞれ数MB~30MB程度のファイルにおさまり、shell scriptでcatすると600万行ほどのファイルにまとまった。 書誌情報が構造化されて登録されている中で、タイトルと抄録のテキストからキーワードを収集しようとすると、行頭…

本ブログではamazon associate広告を利用しています。