<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>PDF &#8211; dr-harv-blog</title>
	<atom:link href="https://www.dr-harv.com/tag/pdf/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.dr-harv.com</link>
	<description></description>
	<lastBuildDate>Mon, 30 Jun 2025 05:10:39 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.2</generator>

<image>
	<url>https://www.dr-harv.com/wp-content/uploads/2022/11/cropped-shutterstock_1897171960-32x32.jpg</url>
	<title>PDF &#8211; dr-harv-blog</title>
	<link>https://www.dr-harv.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>【医師・研究者のPython】PDF論文の「表」を、コピペせずに一瞬でExcel化するTabula活用術</title>
		<link>https://www.dr-harv.com/post10582/</link>
		
		<dc:creator><![CDATA[drｰharv]]></dc:creator>
		<pubDate>Wed, 10 Apr 2024 08:00:27 +0000</pubDate>
				<category><![CDATA[医学研究とデータサイエンス]]></category>
		<category><![CDATA[CSV]]></category>
		<category><![CDATA[CSV変換]]></category>
		<category><![CDATA[pandas]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[PDF抽出]]></category>
		<category><![CDATA[Python]]></category>
		<category><![CDATA[Tabula]]></category>
		<category><![CDATA[データ抽出]]></category>
		<category><![CDATA[メタアナリシス]]></category>
		<category><![CDATA[医師]]></category>
		<category><![CDATA[研究]]></category>
		<category><![CDATA[研究者]]></category>
		<category><![CDATA[自動化]]></category>
		<category><![CDATA[論文]]></category>
		<guid isPermaLink="false">https://www.dr-harv.com/?p=10582</guid>

					<description><![CDATA[<p><img src="https://www.dr-harv.com/wp-content/uploads/2024/04/PythonでPDFから表データを抽出する方法-1024x538.png" class="webfeedsFeaturedVisual" /></p>メタアナリシスのため、何十もの先行研究論文の「結果の表」を、ひたすら手作業でExcelに転記する…。 この、時間と集中力を浪費する、非創造的な作業にうんざりしていませんか？ 実は、このプロセスはPythonを使えば、数分 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://www.dr-harv.com/wp-content/uploads/2024/04/PythonでPDFから表データを抽出する方法-1024x538.png" class="webfeedsFeaturedVisual" /></p>
<p>メタアナリシスのため、何十もの先行研究論文の「結果の表」を、ひたすら手作業でExcelに転記する…。</p>



<p>この、時間と集中力を浪費する、非創造的な作業にうんざりしていませんか？ 実は、このプロセスはPythonを使えば、数分で自動化できます。</p>



<p>この記事では、PDFという「牢獄」に閉じ込められた貴重な表データを「解放」し、あなたの研究を加速させるための、具体的なプロトコルを解説します。</p>



<h2 class="wp-block-heading">なぜ、この「データ抽出スキル」が研究の質を左右するのか？</h2>



<p>この一見地味な技術が、我々の研究活動に大きなアドバンテージをもたらす理由は3つあります。</p>



<p><strong>① 圧倒的な時間短縮と、人的ミスの排除:</strong> 手作業による転記ミスは、研究の信頼性を損なう最大のリスクの一つです。自動化は、このリスクを根本から断ち切り、何時間もかかっていた作業を、文字通り数秒で終わらせます。</p>



<p><strong>② メタアナリシス・系統的レビューの実現可能性UP:</strong> データ収集のハードルが劇的に下がることで、これまで時間的な制約で諦めていたような、より多くの論文を対象とした、大規模で質の高いレビュー研究も可能になります。</p>



<p><strong>③ データに基づく、客観的な診療・研究へ:</strong> 容易に扱えるデータが増えることは、より客観的な根拠に基づいた臨床判断や、新たな研究仮説の発見に繋がります。</p>



<ul class="wp-block-list">
<li>PDF内の表を<strong>自動で読み込み→表形式のデータ抽出</strong></li>



<li>データをそのまま<strong>CSVやExcelとして出力</strong></li>



<li>特定ページだけ、複数テーブル、複雑な表構造にも対応！</li>
</ul>



<h2 class="wp-block-heading"><img src="https://s.w.org/images/core/emoji/16.0.1/72x72/1f6e0.png" alt="🛠" class="wp-smiley" style="height: 1em; max-height: 1em;" /> 事前準備：環境構築</h2>



<h3 class="wp-block-heading">① ライブラリのインストール</h3>



<p>bash</p>



<p><code>pip install tabula-py pandas</code></p>



<p>「自分のPCに色々インストールするのは面倒だ…」という先生には、<strong>Google Colaboratory</strong>の利用を強くお勧めします。Webブラウザだけで、すでにPythonや各種ライブラリが準備された環境を、無料で利用できます。</p>


<div class="swell-block-postLink">			<a href="https://www.dr-harv.com/post7343/" class="c-blogLink -external" data-style="slim" target="_blank" rel="noopener noreferrer">
				<!-- <i class="c-blogLink__icon icon-link" role="presentation"></i> -->
				<span class="c-blogLink__icon">
					<svg xmlns="http://www.w3.org/2000/svg" class="swl-svg-externalLink __svg" width="1em" height="1em" viewBox="0 0 48 48" role="img" aria-hidden="true" focusable="false"><path d="M44 2H30c-1.1 0-2 .9-2 2s.9 2 2 2h9.2L24 21.2c-.8.8-.8 2 0 2.8s2 .8 2.8 0L42 8.8V18c0 1.1.9 2 2 2s2-.9 2-2V4c0-1.1-.9-2-2-2z" /><path d="M41 27c-1.1 0-2 .9-2 2v10c0 1.1-.9 2-2 2H9c-1.1 0-2-.9-2-2V11c0-1.1.9-2 2-2h10c1.1 0 2-.9 2-2s-.9-2-2-2H9c-3.3 0-6 2.7-6 6v28c0 3.3 2.7 6 6 6h28c3.3 0 6-2.7 6-6V29c0-1.1-.9-2-2-2z" /></svg>				</span>
				<span class="c-blogLink__text">Google Colaboratoryでプログラミング学習環境を作る</span>
			</a>
		</div>


<h3 class="wp-block-heading">②Javaのインストール</h3>



<p><a href="https://www.java.com/en/download/manual.jsp">Java Downloads for All Operating Systems</a></p>



<p>OS毎（Windows,Mac, Linux）にダウンロード可能ですが、<strong>Windows環境ではWindows Offline(64bit)をダウンロードしてインストール</strong>します</p>



<p>インストールの確認</p>



<p>コマンドプロンプトやターミナルで以下のコマンドを実行します、インストールされていればバージョン情報が表示されます</p>



<div class="hcb_wrap"><pre class="prism line-numbers lang-plain"><code>java -version</code></pre></div>



<h3 class="wp-block-heading">③ 環境変数PATHの設定（Windows）</h3>



<p>Javaを実行できるように実行可能ファイル(java.exe)が環境変数PATHに含まれるように設定します。いわゆる、PATHを通すということです。</p>



<p><strong>環境変数の設定方法</strong>:</p>



<ul class="wp-block-list">
<li><strong>Windows</strong>の場合、コントロールパネルの「システム」→「システムの詳細設定」→「環境変数」でPATHを編集できます。Javaがインストールされているディレクトリ（通常は「C:\Program Files\Java\jdk[バージョン]\bin」）をPATHに追加してください。</li>



<li><strong>macOS/Linux</strong>の場合、ターミナルで<code>.bashrc</code> や <code>.bash_profile</code> （または使用しているシェルに応じた設定ファイル）を編集し、<code>export PATH=$PATH:/path/to/java/bin</code> の形式でJavaのパスを追加します。</li>
</ul>



<p>コンピュータを再起動することで設定変更が反映されるようになります</p>



<h2 class="wp-block-heading"><img src="https://s.w.org/images/core/emoji/16.0.1/72x72/1f4e5.png" alt="📥" class="wp-smiley" style="height: 1em; max-height: 1em;" /> 実行コード：PDFから表を読み込んでCSVに保存</h2>



<div class="hcb_wrap"><pre class="prism line-numbers lang-python" data-lang="Python"><code>import tabula
import pandas as pd

# PDFファイルのパス
file_path = &quot;example.pdf&quot;

# 表の読み込み（複数ページ、複数テーブル対応）
tables = tabula.read_pdf(file_path, pages=&quot;all&quot;, multiple_tables=True)

# CSVとして保存
for i, table in enumerate(tables):
    table.to_csv(f&quot;table_{i}.csv&quot;, index=False)
</code></pre></div>



<h3 class="wp-block-heading"><img src="https://s.w.org/images/core/emoji/16.0.1/72x72/1f501.png" alt="🔁" class="wp-smiley" style="height: 1em; max-height: 1em;" /> ポイント：</h3>



<ul class="wp-block-list">
<li><code>multiple_tables=True</code>で1ページに複数の表があるPDFにも対応</li>



<li><code>pages='1,3'</code>などで指定ページのみ抽出も可能</li>
</ul>



<h3 class="wp-block-heading">JPypeのインストール</h3>



<p>上記でJavaのインストールと実行が可能ですが依存関係のエラーがでることがありサブプロセスを使用することがありました</p>



<p><code>Error importing jpype dependencies. Fallback to subprocess. No module named 'jpype</code></p>



<p>JavaプログラムをPythonから直接呼び出して実行することを可能とするライブラリJPypeを利用します</p>



<div class="hcb_wrap"><pre class="prism line-numbers lang-plain"><code>pip install JPype1</code></pre></div>



<h2 class="wp-block-heading">PDFファイルからの表データの抽出</h2>



<p>以下のステップに従って、PDFから表データを抽出します：</p>



<h4 class="wp-block-heading">ステップ1: 必要なライブラリのインポート</h4>



<p>まず、必要なライブラリをインポートします。</p>



<p>python</p>



<p><code>import tabula import pandas as pd</code></p>



<h4 class="wp-block-heading">ステップ2: PDFファイルの読み込み</h4>



<p>Tabulaを使用してPDFファイルを読み込み、表データを取得します。例えば、<code>example.pdf</code>というファイルからデータを抽出する場合、以下のコードを使用します：</p>



<p>python</p>



<p><code>file_path = 'example.pdf' tables = tabula.read_pdf(file_path, pages='all', multiple_tables=True)</code></p>



<p>このコードは、PDFファイルのすべてのページから複数の表を読み込みます。</p>



<h4 class="wp-block-heading">ステップ3: データの操作と保存</h4>



<p>読み込んだ表データはPandasのDataFrame形式で返されます。これにより、データの操作や分析が容易になります。以下はデータをCSVファイルに保存する例です：</p>



<p>python</p>



<p><code>for i, table in enumerate(tables): table.to_csv(f'table_{i}.csv', index=False)</code></p>



<h2 class="wp-block-heading">エラーメッセージの対処法</h2>



<p><code>Error importing jpype dependencies. Fallback to subprocess.</code>というエラーが出る場合は、JPype1のインストールを確認し、再インストールを試みてください。</p>



<h2 class="wp-block-heading">PythonでPDFの表をcsvに</h2>



<p>PythonでPDF内の表(テーブル)をcsvやexcelに変換する手順は2ステップです。</p>



<p>ステップ1. PDFから表をpandasのDataFrameとして抜き出す<br>ステップ2. DataFrameをcsvやexcelとして書き込む</p>



<h2 class="wp-block-heading">まとめ</h2>



<p>PythonとTabula-py、Pandasを使えば、PDFから表データを効率的に抽出し、CSVやExcelファイルとして保存できます。このプロトコルをマスターすることで、先生は退屈なデータ入力作業から解放され、その時間を、医師・研究者として本来最も価値のある<strong>「データの解釈」「新しい仮説の構築」「論文の考察」</strong>といった、創造的な思考に集中させることができるようになります。</p>




]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>【解決】ExcelのPDFリンクが切れる問題を防ぐ！絶対に切れないハイパーリンク作成術</title>
		<link>https://www.dr-harv.com/post10547/</link>
		
		<dc:creator><![CDATA[drｰharv]]></dc:creator>
		<pubDate>Sat, 06 Apr 2024 05:23:11 +0000</pubDate>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[Excel]]></category>
		<category><![CDATA[HYPERLINK関数]]></category>
		<category><![CDATA[PDF]]></category>
		<category><![CDATA[ハイパーリンク]]></category>
		<category><![CDATA[リンク切れ]]></category>
		<category><![CDATA[業務効率化]]></category>
		<category><![CDATA[相対パス]]></category>
		<guid isPermaLink="false">https://www.dr-harv.com/?p=10547</guid>

					<description><![CDATA[<p><img src="https://www.dr-harv.com/wp-content/uploads/2024/04/スクリーンショット-2024-04-06-135447.png" class="webfeedsFeaturedVisual" /></p>Excelで作成したファイル一覧から、ワンクリックで該当の報告書PDFを開きたい… たくさんの資料をExcelで管理したいけど、いちいちフォルダを探すのが面倒… そんなお悩みを解決するのが、Excelのハイパーリンク機能 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://www.dr-harv.com/wp-content/uploads/2024/04/スクリーンショット-2024-04-06-135447.png" class="webfeedsFeaturedVisual" /></p>
<p>Excelで作成したファイル一覧から、ワンクリックで該当の報告書PDFを開きたい… たくさんの資料をExcelで管理したいけど、いちいちフォルダを探すのが面倒…</p>



<p>そんなお悩みを解決するのが、Excelの<strong>ハイパーリンク機能</strong>です。</p>



<p>しかし、ただリンクを作成しただけでは、ファイルの場所を移動した際に「ファイルが見つかりません」というエラーが起きてしまいがち。</p>



<p>この記事を読めば、その悩みを根本から解決し、Excel作業を劇的に効率化する方法がわかります。</p>



<h2 class="wp-block-heading">ExcelシートのPDFファイルハイパーリンク作成</h2>



<div class="swell-block-step" data-num-style="circle">
<div class="swell-block-step__item"><div class="swell-block-step__number u-bg-main"><span class="__label">STEP</span></div><div class="swell-block-step__title u-fz-l">リンクテキストの作成</div><div class="swell-block-step__body">

</div></div>



<div class="swell-block-step__item"><div class="swell-block-step__number u-bg-main"><span class="__label">STEP</span></div><div class="swell-block-step__title u-fz-l">ハイパーリンクの設定</div><div class="swell-block-step__body">

</div></div>



<div class="swell-block-step__item"><div class="swell-block-step__number u-bg-main"><span class="__label">STEP</span></div><div class="swell-block-step__title u-fz-l">リンクの確認</div><div class="swell-block-step__body">

</div></div>
</div>



<h2 class="wp-block-heading">ステップ1　リンクテキストの作成</h2>



<p>まずリンクテキストを作成します。このテキストは、クリックするとPDFが開くハイパーリンクとなります。</p>



<h2 class="wp-block-heading">ステップ2　ハイパーリンクの設定</h2>



<p>リンクテキストが書かれたセルを右クリックし、「ハイパーリンク」オプションを選択します。</p>



<p>「既存のファイルまたはWebページ」を選び、リンク先にPDFファイルを指定します。</p>







<h2 class="wp-block-heading">ステップ3　リンクの確認</h2>



<p>設定後、リンクテキストにハイパーリンクが適用されたことを確認します。</p>



<p>テキストをクリックすると、関連するPDFファイルが開きます。</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="737" height="415" src="https://www.dr-harv.com/wp-content/uploads/2024/04/スクリーンショット-2024-04-06-135447.png" alt="テキスト、PDFハイパーリンク" class="wp-image-10548" style="width:549px;height:auto" srcset="https://www.dr-harv.com/wp-content/uploads/2024/04/スクリーンショット-2024-04-06-135447.png 737w, https://www.dr-harv.com/wp-content/uploads/2024/04/スクリーンショット-2024-04-06-135447-300x169.png 300w" sizes="(max-width: 737px) 100vw, 737px" /></figure>



<h2 class="wp-block-heading">【最重要】誰もがハマる「リンク切れ」の原因と完璧な対策</h2>



<p class="is-style-icon_info">リンクは元のPDFファイルの場所を動かしてしまうと、リンクが切れてしまいますので再度の設定が必要です。</p>



<p>基本操作は簡単ですが、この方法には大きな弱点があります。それは、<strong>ExcelファイルやPDFファイルの保存場所を移動すると、リンクが切れてしまう</strong>ことです。</p>



<p>この章では、その原因と、二度とリンク切れを起こさないための完璧な対策を解説します。</p>



<h4 class="wp-block-heading"><strong>なぜリンクは切れる？「絶対パス」の落とし穴</strong></h4>



<p>先ほどの基本操作で作成されるリンクは、「<strong>絶対パス</strong>」で設定されています。</p>



<p><strong>絶対パスとは？</strong> <code>C:\Users\YourName\Documents\Reports\report_A.pdf</code> のように、PCのドライブ名から始まる、ファイルの「完全な住所」のことです。</p>



<p>この「完全な住所」が記録されているため、フォルダごと別の場所に移動したり、他の人にフォルダごと渡したりすると、「指定された住所にファイルがありません」となり、リンクが切れてしまうのです。</p>



<h4 class="wp-block-heading"><strong>【解決策】ファイルを動かしてもOK！「相対パス」でリンクを作成する方法</strong></h4>



<p>この問題を解決するのが、「<strong>相対パス</strong>」と「<strong><code>HYPERLINK</code>関数</strong>」です。</p>



<p><strong>相対パスとは？</strong> Excelファイルから見た、PDFファイルの「相対的な位置関係」のことです。（例：「Excelファイルと同じ場所にある」「一つ上のフォルダの中にある」）</p>



<p>この「相対パス」を使えば、フォルダごと移動しても位置関係は変わらないため、リンクが切れません。そして、相対パスでのリンク作成には<code>HYPERLINK</code>関数を使うのが最も簡単で確実です。</p>



<h5 class="wp-block-heading"><strong><code>HYPERLINK</code>関数の使い方</strong></h5>



<p>リンクを貼りたいセルに、以下のように関数を入力します。</p>



<p><code>=HYPERLINK("リンク先のファイル名", "セルに表示する文字")</code></p>



<p><strong>【使用例1：ExcelファイルとPDFが同じフォルダにある場合】</strong></p>



<p><code>=HYPERLINK("report_A.pdf", "報告書Aを開く")</code></p>



<p>【図：HYPERLINK関数が入力されたセルと、その結果表示されているリンクのスクリーンショット】</p>



<p><strong>【使用例2：Excelファイルの一つ下の「資料」フォルダにPDFがある場合】</strong></p>



<p><code>=HYPERLINK("資料\report_A.pdf", "【資料】報告書A")</code></p>



<p>この方法を使えば、同僚にフォルダごとメールで送っても、サーバー上でフォルダを移動しても、リンクが切れることはありません。<strong>PDFへのリンクはこの<code>HYPERLINK</code>関数を使うのがベストプラクティス</strong>と覚えておきましょう。</p>



<h3 class="wp-block-heading"><strong>3. 【応用編】もっと便利になるハイパーリンク活用術</strong></h3>



<p><code>HYPERLINK</code>関数を使いこなせば、さらに便利な設定が可能です。</p>



<h4 class="wp-block-heading"><strong>活用術①：PDFの「特定のページ」を直接開く</strong></h4>



<p>長い報告書の結論部分だけを直接開きたい…そんな時は、ファイル名の後ろに<code>#page=ページ番号</code>を付け加えます。</p>



<p><strong>【使用例：report_A.pdfの5ページ目を開きたい場合】</strong></p>



<p><code>=HYPERLINK("report_A.pdf#page=5", "報告書Aの結論(P.5)を開く")</code></p>



<p>これにより、クリック一つで目的のページにジャンプでき、探す手間が省けます。</p>



<h4 class="wp-block-heading"><strong>活用術②：リンクの見た目（青文字・下線）を変更する</strong></h4>



<p>ハイパーリンクの青文字・下線が好みでない場合は、通常のセルの書式設定で見た目を自由に変更できます。</p>



<ol class="wp-block-list">
<li>リンクが設定されたセルを選択します。</li>



<li>「ホーム」タブから、フォントの色や下線の有無などを自由に変更します。</li>
</ol>



<p>見た目を変えてもリンク機能は失われないので、表のデザインに合わせて調整しましょう。</p>



<h3 class="wp-block-heading"><strong>まとめ：HYPERLINK関数を使いこなし、資料管理の達人に！</strong></h3>



<p>今回は、ExcelでPDFへのハイパーリンクを作成する方法を解説しました。</p>



<ul class="wp-block-list">
<li><strong>基本操作:</strong> 右クリックから簡単に設定できる。</li>



<li><strong>最大の問題点:</strong> ファイルを動かすと「絶対パス」のためリンクが切れる。</li>



<li><strong>完璧な解決策:</strong> <strong><code>HYPERLINK</code>関数を使って「相対パス」でリンクを作成する。</strong></li>



<li><strong>応用:</strong> <code>#page=5</code>で特定のページを開ける。</li>
</ul>



<p>特に、<code>HYPERLINK</code>関数を使った相対パスでのリンク作成は、チームでのファイル共有や将来のフォルダ整理で絶大な効果を発揮します。ぜひこの機会にマスターして、日々の業務を効率化してください。</p>



<h2 class="wp-block-heading">関連記事</h2>



<figure class="wp-block-embed is-type-wp-embed is-provider-dr-harv-blog wp-block-embed-dr-harv-blog"><div class="wp-block-embed__wrapper">
https://www.dr-harv.com/post7443
</div></figure>



<figure class="wp-block-embed is-type-wp-embed is-provider-dr-harv-blog wp-block-embed-dr-harv-blog"><div class="wp-block-embed__wrapper">
https://www.dr-harv.com/post9732
</div></figure>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
