Question 1

圖片轉文字是如何運作的？

Accepted Answer

我們使用 Tesseract.js，一個完全在瀏覽器中運行的開源 OCR（光學字元辨識）引擎。它分析圖片像素以辨識字母、單詞和段落。

Question 2

支援哪些語言？

Accepted Answer

從下拉選單中選擇 20 多種常用語言，包括中文、日文、韓文、阿拉伯文、印地文和主要歐洲語言。Tesseract.js 總共支援 100 多種語言。語言資料首次使用時下載（每種語言約 2-15MB）。

Question 3

我的圖片會上傳到伺服器嗎？

Accepted Answer

不會。所有 OCR 處理都使用 WebAssembly 在瀏覽器本地完成。您的圖片永遠不會離開您的裝置。

Question 4

支援哪些圖片格式？

Accepted Answer

JPEG、PNG、WebP、BMP 和 TIFF。為獲得最佳效果，請使用高對比度且文字清晰的圖片。掃描文件建議最低 300 DPI。

Question 5

辨識準確度如何？

Accepted Answer

準確度取決於圖片品質。清晰、高解析度且使用標準字體的圖片通常可達到 95% 以上的準確率。手寫文字、低解析度或特殊字體可能降低準確度。

Question 6

可以從手寫文字中提取文字嗎？

Accepted Answer

Tesseract.js 主要針對印刷文字訓練。手寫辨識能力有限，效果通常較差——尤其是草書。對於手寫文字，像 Google Vision API 這樣的專用服務效果會好得多。

Question 7

可以同時處理多張圖片嗎？

Accepted Answer

可以。您可以一次上傳多張圖片。工具會依序處理並將所有提取的文字輸出在單一結果中，每張圖片的文字都有清楚標示。您可以複製合併的文字或下載為 .txt 檔案。

Question 8

切換語言時會發生什麼？

Accepted Answer

首次選擇新語言時，Tesseract.js 會下載對應的語言資料檔（通常每種語言 2-15MB，首次使用後快取）。英文始終預載，無需額外下載。處理時間因語言複雜度而異。

Question 9

為什麼首次 OCR 運行較慢？

Accepted Answer

OCR 引擎和所選語言資料在首次使用時下載並快取在瀏覽器中。同一工作階段中的後續運行會快得多。進度條和狀態文字顯示初始化期間的進度。

圖片轉文字（OCR）

How It Works