ほぼテク読者の皆様、いつも大変ありがとうございます!
我妻裕太です。
GPTに関する連続投稿約105日目です!
本日は「文章の中の大事な単語を拾い出す」実験をChatGPTで試してみようシリーズです。
ChatGPTを有効活用できないか毎日試行錯誤中です!
本日のテーマは医療情報です!
医療情報分析における固有名詞抽出の可能性
よくある課題
医療業界における情報分析は、診断、治療法の選択、そして疾患のパターンの理解に至るまで、多くの可能性をもたらす一方、特有の困難さも伴います。電子健康記録(EHR)や医学論文は、重要な情報が文字情報として膨大な量に記録されており、その分析は手作業によるものが主流です。しかし、手作業による情報の抽出は時間と労力を大いに必要とし、その結果、価値ある情報が見逃されることもあります。
ちなみに電子健康記録(Electronic Health Record、EHR)とは?
電子健康記録(EHR)は、日本では「電子カルテ」と呼ばれるケースもあります。電子カルテは、医療情報をデジタル化して保存・管理するシステムの一種で、患者の医療情報を時間と場所を問わずに確認できるという利点があります。
しかし、「電子カルテ」と「電子健康記録(EHR)」という言葉は、少し異なるニュアンスを持つこともあります。電子カルテは主に一つの医療機関内での患者情報の管理に使われます。一方で、EHRは患者の情報をさまざまな医療機関やケアプロバイダー間で共有することを目指しています。
ただし、この区別は必ずしも厳密なものではなく、文脈によっては「電子カルテ」と「電子健康記録」が同義として使われることもあります。
それでは上記を踏まえて改めて説明をさせていただきます!
電子健康記録(Electronic Health Record、EHR)とは、患者の診療情報(病歴、診断、治療、処方、検査結果、アレルギー等)を電子的に記録・保存するシステムです。EHRは、医療従事者が患者の診療情報を共有し、より安全で効率的な医療を提供することを目的としています。
EHRには、以下のようなメリットがあります。
- 医療ミスの防止
- 患者の診療情報の共有
- 患者の自己管理の促進
- 医療費の削減
- 医療の質の向上
EHRは、医療の質を向上させ、患者の安全を守るために、重要な役割を果たしています
以下に、EHRの具体的なメリットを7つご紹介します。
1.医療ミスの防止
EHRは、紙のカルテに比べて、医療ミスの防止に効果的です。紙のカルテは、紛失や破損するリスクがあります。また、情報が手書きで書かれていることが多く、読み間違いや書き間違いが起こりやすいです。EHRは、電子化されているため、紛失や破損のリスクが低く、読み間違いや書き間違いが起こりにくいです。
2.患者の診療情報の共有
EHRは、患者の診療情報を医療機関間で共有することができます。これにより、患者が受診した医療機関の医療従事者が、患者の診療情報を共有して、より安全で効率的な医療を提供することができます。
3.患者の自己管理の促進
EHRは、患者が自分の診療情報を閲覧することができます。これにより、患者は自分の健康状態を把握し、自分の病気を管理することができます。
4.医療費の削減
EHRは、医療費の削減に効果的です。EHRは、医療従事者の業務効率を向上させ、医療ミスを防止することができます。これにより、医療費の削減につながります。
5.医療の質の向上
EHRは、医療の質を向上させます。EHRは、患者の診療情報を共有することで、医療従事者がより適切な診断や治療を行うことができます。また、EHRは、患者の自己管理を促進することで、患者の病気の重症化を予防することができます。
6.患者の満足度の向上
EHRは、患者の満足度を向上させます。EHRは、患者が自分の診療情報を閲覧することができ、自分の健康状態を把握することができます。また、EHRは、患者の診療情報の共有により、患者はより安全で効率的な医療を受けることができます。
7.医療の効率化
EHRは、医療の効率化を図ります。EHRは、医療従事者の業務効率を向上させ、医療ミスを防止することができます。これにより、医療の効率化につながります。
EHRは、医療の質を向上させ、患者の安全を守るために、重要な役割を果たしています。EHRの導入は、医療の効率化や患者の満足度向上にもつながります。
固有名詞抽出の利点
ここで固有名詞抽出の登場です。固有名詞抽出は、自然言語処理(NLP)の一分野で、特定の情報(この場合は病名や薬物名など)をテキストから抽出するために使用されます。これにより、人間が手作業で行うことの難しい大量のテキストデータから、特定の情報を効率的に抽出できるようになります。
ChatGPTを活用した運用イメージ
ChatGPTを活用して医療情報の固有名詞抽出システムを構築すると、上記の問題を効果的に解決することができます。ChatGPTは大規模なテキストデータを学習する能力を持っており、その結果得られる理解力を活用して、電子健康記録や医学論文から重要な情報を抽出することが可能です。
具体的な運用イメージとしては、システムに電子健康記録や医学論文を入力すると、そのテキストから病名や薬物名、さらには治療法や試験結果などの重要な情報を自動的に抽出します。これにより、情報を手作業で検索し、抽出する手間が大幅に軽減され、より高度な分析や理解に時間を割くことができます。
それでは早速試してみよう!
実験ルール
・サンプルのテキストデータから疾患、薬物、関連性について抽出できるか実験します。
・GPT-3.5で実験する。
・プロンプトは以下で実行します。
【プロンプト】
このテキストから、疾患の名前をすべて見つけてください。
このテキストから、薬物の名前をすべて見つけてください。
どのようなルールで抽出したのかの根拠も書いてください。
薬物の使用と疾患発症の関連性について述べられている情報を抽出してください。
【テキスト】
“MRI結果によれば、患者の左腎臓には直径3cmの塊が存在しました。初診時の症状は背部の痛みで、血液検査では高いクレアチニンレベルが確認されました。”
“新たな抗生物質、Curemycinは、耐性を持つ黄色ブドウ球菌に対して有効であるとの最近の報告があります。この結果は、Curemycinが新たなMRSA治療法としての可能性を持つことを示唆しています。”
“心房細動の早期発見は、脳卒中のリスクを軽減するために重要です。我々の最新の研究では、心電図とAIを組み合わせることで、心房細動の非常に早い段階での発見が可能となることを発見しました。”
“タイプ1糖尿病患者において、定期的なインスリン注射が血糖レベルを管理するのに有効であることが広く認識されています。しかし、最新の研究では、特定の食事療法がインスリンの依存度を減らす可能性があることが示されています。”
“本研究では、B型肝炎患者に対する新しい治療法として、抗ウイルス薬Zelonafirの使用を評価しました。Zelonafirを使用した患者は、プラセボ群に比べて有意に良好な結果を示しました。”
“免疫療法は、特定のがんタイプ、特に肺がんや腎臓がんの治療で効果を示しています。新しい免疫チェックポイント阻害薬Immunoxinは、既存の治療法に比べて有意に良好な結果を示しました。”
“乳がんのスクリーニングは、初期段階での発見と治療を可能にします。最近の研究では、新しい画像解析技術とAIの組み合わせが、乳がんの早期発見に有効であることが示されました。”
“臨床試験では、新しい心臓血管薬Revacorが高血圧患者の血圧を有意に下げることが確認されました。これは、Revacorが新たな高血圧治療法としての可能性を示すものです。”
“Alzheimexは、アルツハイマー病の進行を遅らせるための新たな薬物であり、初期の試験では有望な結果を示しています。Alzheimexを使用した患者は、認知機能の低下が遅く、生活の質が改善しました。”
“最近の研究では、定期的な運動と健康的な食事が、2型糖尿病の予防に有効であることが示されています。特に、低糖質の食事と適度な有酸素運動が血糖値の管理に効果的です。”
※上記のデータは、主に医療関連の記事や研究レポート、臨床試験の結果などを短くまとめたものとなります。実際の電子健康記録(EHR)や学術論文の一部分というよりは、各研究の要約や結果の概要を記述したものとしてご理解いただければと思います。
電子健康記録や論文の具体的なテキストは、患者のプライバシー保護や学術的な著作権などの理由から、公に共有されることは少ないため、デモデータとしては、上記のような形式を利用することが一般的です。
【デモ動画】
【抽出結果】
疾患の名前を抽出すると次のようになります:
- 脳卒中
- 心房細動
- タイプ1糖尿病
- B型肝炎
- がん(肺がん、腎臓がん、乳がん)
- 高血圧
- アルツハイマー病
- 2型糖尿病
薬物の名前を抽出すると次のようになります:
- Curemycin (抗生物質)
- Zelonafir (抗ウイルス薬)
- Immunoxin (免疫チェックポイント阻害薬)
- Revacor (心臓血管薬)
- Alzheimex (アルツハイマー病治療薬)
抽出の根拠:
疾患名:テキスト中に明確に示されている疾患名は直接抽出されました。
薬物名:テキスト中に薬物名として明確に示されている言及があった場合に抽出しました。
薬物の使用と疾患発症の関連性について述べられている情報を抽出すると次のようになります:
Curemycinは耐性を持つ黄色ブドウ球菌に対して有効であるとの報告があります。これによりCuremycinが新たなMRSA治療法としての可能性を持つことが示唆されています。→ CuremycinはMRSA(メチシリン耐性黄色ブドウ球菌)の治療に有望であるとされています。
抗ウイルス薬Zelonafirの使用により、B型肝炎患者に対して有意に良好な結果が示されました。→ ZelonafirはB型肝炎の治療に効果があることが示唆されています。
免疫チェックポイント阻害薬Immunoxinは、特定のがんタイプ、特に肺がんや腎臓がんの治療で有意な結果を示しました。→ Immunoxinは肺がんや腎臓がんの治療に有効であるとされています。
新しい心臓血管薬Revacorが高血圧患者の血圧を有意に下げることが確認されました。→ Revacorは高血圧治療に有望であるとされています。
Alzheimexはアルツハイマー病の進行を遅らせるための新たな薬物であり、初期の試験では有望な結果を示しています。→ Alzheimexはアルツハイマー病の治療に有効であるとされています。
注意:テキスト内の情報は架空のものであり、実際の薬物や疾患とは関係ありません。抽出された情報は架空のシナリオに基づいています。
おぉ、今日もでましたね。驚きのおー。こんな一瞬で情報抽出できるとは。
さすが!LLM界のスピードスター!
では早速抽出結果を見てみましょう!
疾患、薬物を抽出してくれています。疾患については実際の病名を抽出してくれています!凄い。
さすが事前に大量のテキストを学習しているだけあって知識が豊富ですね。
今まではこれをやるために疾患の情報を集める必要があったのですが、一般的な内容であれはChatGPTで十分ですね。テキスト内に現れる疾患名は一般的な医学用語であり、特定のパターンに基づいて識別されているようです!
続きまして薬物につきましては今回実在しない薬物なのですが、抽出しているようです。
なんで抽出しているのかというと、抽出の根拠で「テキスト中に薬物名として明確に示されている言及があった場合に抽出しました。」ということで、文脈を読み取って、薬物名として書かれているだろう!の箇所を空気を読んで抽出してくれているようです。
もちろん間違うこともあるでしょうが、人間でも文章を読んで知らない薬品を推測するときも同じような判断基準ですよね。これはいいですね。
まとめ
っということでいかがでしたでしょうか。
医療情報の分析における固有名詞抽出は、大量のテキストデータから重要な情報を抽出する際の手間と時間を大幅に節約することができます。ChatGPTを活用した固有名詞抽出システムは、そのような問題を解決する有望な手法であり、医療従事者がより有意義なタスクに集中できるようになることで、医療サービス全体の向上に寄与することが期待できるのではないでしょうか。
AIが人間を支えて、人間はもっと創造的な仕事ができる!素晴らしい世界ではないでしょうか。
本日の記事がみなさまの何かのヒントになれば幸いです。
今回も最後までお読みいただき、ありがとうございました。
それでは、また次回のほぼテクでお会いしましょう!
SRA東北の我妻裕太でした。
さようなら!

株式会社SRA東北ビジネス・ディベロップメント
チーフ・ディレクター 我妻裕太
バックナンバー
ほぼテク8月4日動画の字幕をGPTと一緒にクリエイティブしてみました!
ほぼテク8月1日GPTのライバルになるか?満を持して登場のMetaのLlama2で日本語が得意か実験してみました!
ほぼテク 7月31日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!地元宮城県はどこまで計画してくれるか試してみた編!?
ほぼテク 7月28日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!くせになって国内でも旅行計画GPT-4の福岡編!
ほぼテク 7月27日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!くせになって国内でも旅行計画GPT-4の福岡編!
ほぼテク 7月25日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!GPT-3.5のロンドン編!
ほぼテク 7月24日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?研究者ネットワーク編!
ほぼテク 7月21日GPTのライバルになるか?ついに登場IBM WatsonからLLMが登場!その名もwatsonx!
ほぼテク 7月20日GPTと創る新しいビジネス体験の世界へ!Bing Chat EnterpriseとMicrosoft 365 Copilotの進化!
ほぼテク 7月18日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文から引用解析編!
ほぼテク 7月14日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文から専門用語と概念抽出!
ほぼテク 7月13日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文メタデータ編!
ほぼテク 7月11日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?レシピ開発編!
ほぼテク 7月10日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?スケジュール管理編!
ほぼテク 7月7日AIで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?マーケット調査編!
ほぼテク 7月6日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?契約書編!
ほぼテク 7月4日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?ニュース記事の分析編!
ほぼテク 7月3日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?カスタマーサービス編!
ほぼテク 6月30日ChatGPTと固有表現抽出!テキストデータから宝を見つける究極のガイド?SNSマーケティング編!
ほぼテク 6月29日ChatGPTと固有表現抽出!テキストデータから宝を見つける究極のガイド?
ほぼテク 6月27日GPT活用で時短!議事録作成の革新的な効率化テクニック②GPT、Bardで議事録作成!
ほぼテク 6月26日GPT活用で時短!議事録作成の革新的な効率化テクニック①GPTによる架空の議事録生成実験
ほぼテク 6月23日GPTはメールの緊急度はチェックできるのか実験をしました!
ほぼテク 6月22日GPTと自社データをシームレスに結びつける新サービス「Azure OpenAI Service On Your Data」公開プレビュー!を徹底解説!
ほぼテク 6月20日メールをチェックするのはあなたとChatGPT!
ほぼテク 6月19日ChatGPTのリアル活用事例を参考にシステム開発の目線で仕組みを考えてみました!
ほぼテク 6月16日GPT-4!テクノロジーの進化と新たな可能性
ほぼテク 6月15日ChatGPTがさらにパワーアップ!新モデルと機能のリリース情報?
ほぼテク 6月13日大好きChatGPT!全知全能の神様ではない、その真実に迫る?
ほぼテク 6月12日ChatGPTの言語理解力を革新する「大規模言語モデル」を徹底解説?
ほぼテク 6月9日AIを活用した業務効率化!ChatGPTでのタスク管理と優先順位付け?
ほぼテク 6月8日AIとメールの融合?ChatGPTを活用したメール作成術!
ほぼテク 6月6日AIと英語学習の融合?ChatGPTの有効活用法!
ほぼテク 6月5日ChatGPTで金融業でのAI活用?クライアント情報の間違いを探し出す
ほぼテク 6月2日AIの進化とレシピ生成の競争:ChatGPT「GPT-3.5」対「GPT-4」対Google Bard
ほぼテク 6月1日新3大AI!ChatGPT or Google Bard比較パート⑥(一番上手そうなレシピを生成してくれるのはどれか?Google Bard編)
ほぼテク 5月30日新3大AI!ChatGPT or Google Bard比較パート⑤(一番上手そうなレシピを生成してくれるのはどれか?GPT-4編)
5月29日新3大AI!ChatGPT or Google Bard比較パート④(一番上手そうなレシピを生成してくれるのはどれか?GPT-3.5編)
5月26日新3大AI!ChatGPT or Google Bard比較パート③(だれが回答を出す際の音速の貴公子か?)
5月25日ChatGPT or Google Bard比較パート②(生成AIに最新情報は取得できるか)
5月22日(ChatGPTを自社Webサイトに組み込むには? )
5月19日(ChatGPTを自社システム・自社サービスに組み込むには? )
5月15日(ChatGPTと過ごした3日間?AI・人工知能EXPO出展報告、ChatGPT対応ソリューション多数ございます!)
5月2日(スケール則(scaling law):極めて重要な法則)