09月15日
(金)
2023年
XMLフォーマットのオープンアクセスの価値
By Carl Robinson
本ブログ記事は2022年12月1日に原文が投稿されたものの翻訳になります。
「ビジネスモデルからムーブメントまで、オープンアクセスはあらゆるものについて言われてきました」
同僚のロイ・カウフマンは少し前、このように語りました(以下のビデオをご覧ください)。オープンアクセス(OA)コンテンツは多くのメリットをもたらします。特に重要なのは、研究に基づくコラボレーションがさらに容易になること、他の人たちの学習を再利用したり、土台にしたりする権利を得て発見を推進できることです。
「オープンアクセスは、さらに広い『オープン』ムーブメントの一環で、ナレッジやリソースの自由な交換を奨励し、アクセスを拡張して、創造性を推進するものです」(JISC, 2019)
そうすると今日、オープンアクセスライセンスで発表されるコンテンツの数が増加しているのは驚くことではありません。2021年初め、オープンアクセスは増えています。
しかし、オープンアクセスとは一体何でしょうか?
近年、学術出版のエコシステムは、オープンアクセスの加速を求める圧力に応えて、急速に進化しています。一般的にオープンアクセスでは、ユーザーはオープンウェブからフルテキスト論文にアクセスできます。ライセンス料も利用回数に応じた料金も支払うことはなく、追加情報を提供する必要もありません。この短いビデオでは、同僚のロイ・カウフマンがさらに説明しています。
オープンアクセスについての詳細は、CCCの2022年リソースリストをここでご覧ください(英語記事)。
テクノロジにサポートされたリサーチにおいて、オープンアクセス論文をどのように活用できるでしょうか?
オープンアクセスでもそれ以外でも、出版物の量の多さは、多くの研究者や科学者に負担になっています。必要な情報を見つけるにはどうすればいいのか、それが自分の研究に関係があるかどうかをどのように知ることができるのか?シンプルな検索プロセスを超えて、彼らは機械学習(ML)や人工知能(AI)を活用しています。XMLフォーマットの学術コンテンツは、テキストマイニングなどのプロセスを通して、そのような機械のトレーニングを支援する潤沢なリソースです。
しかし、機械をうまくトレーニングするためには、おそらく何百万本もの、大量の論文が必要でしょう。
一部の組織にとっては、XMLコンテンツにアクセスすること、特に大量にアクセスすることは、困難かもしれません。そのコンテンツにアクセスする権限とコンテンツのマイニングをする権利を確実に取得することが重要なのでなおさらです。大量にアクセスするには、オープンアクセスコンテンツはソリューションになるかもしれません。
一部のオープンアクセスライセンス(特にCC-BY)は、さらに突っ込んだ利用を認めることによって研究を支援しています。その中には、大量のデータの中でパターンを探し見つけることができるテキストマイニングやデータマイニングがあります(これについては以前の投稿で書きました【英語記事】)。
CCCの核となるミッションには、イノベーションを推進し、ナレッジを加速することが含まれています。オープンアクセスの価値と、私たちがすでにXMLコンテンツに関して提供している価値を組み合わせることによって、私たちはまさにそのミッションに向かっています。
機械学習とAIで研究と業務を支援するために:
- 私たちは量を提供しています:300万本以上のCC-BY論文がすでに半標準化されており、容易に取り込めるようになっています。
- アクセスを容易にしています:必要なものを容易に検索、ダウンロードできます。直接的にコンテンツをダウンロードあるいは自分が選んだテキストおよびデータマイニングツールにインポートするためのAPIアクセスも含まれています。
- CC-BYコンテンツのみを提供しているため、これらの論文の商用マイニングを行うために別途ライセンスを取得する必要はありません。
RightFind XML オープンアクセスは、機械読み取り可能なCC-BYオープンアクセス論文を一元化、科学文献をナレッジ抽出ツールに統合するのをシンプルにして、豊かな成果を導きます。