Skip to content
Home/ AI Tools/ Image Tools/ 圖片轉文字(OCR)

圖片轉文字(OCR)

從圖片、截圖和掃描文件中提取文字——100% 在瀏覽器中處理

100% free Browser-only processing Files never leave your device
Upload Image

Drop images here or click to upload

JPEG, PNG, WebP, BMP supported — multiple images OK

Result

Extracted text appears here

Upload an image and click Extract Text

Files processed locally — never uploaded

Also try: AI Humanizer · Summarizer · Rewriter 3 free uses/day

How It Works

1

上傳您的圖片

拖放或選擇一張或多張圖片(JPEG、PNG、WebP、BMP)。多張圖片依序處理。

2

選擇語言

從 20 多種語言中選擇,包括中文、日文、阿拉伯文和印地文。Tesseract.js 支援 100 多種語言。

3

提取並複製文字

點擊提取文字,OCR 引擎透過 WebAssembly 在本地運行。複製結果為純文字或 Markdown,或下載為 .txt 檔案。

FAQ

圖片轉文字是如何運作的?
我們使用 Tesseract.js,一個完全在瀏覽器中運行的開源 OCR(光學字元辨識)引擎。它分析圖片像素以辨識字母、單詞和段落。
支援哪些語言?
從下拉選單中選擇 20 多種常用語言,包括中文、日文、韓文、阿拉伯文、印地文和主要歐洲語言。Tesseract.js 總共支援 100 多種語言。語言資料首次使用時下載(每種語言約 2-15MB)。
我的圖片會上傳到伺服器嗎?
不會。所有 OCR 處理都使用 WebAssembly 在瀏覽器本地完成。您的圖片永遠不會離開您的裝置。
支援哪些圖片格式?
JPEG、PNG、WebP、BMP 和 TIFF。為獲得最佳效果,請使用高對比度且文字清晰的圖片。掃描文件建議最低 300 DPI。
辨識準確度如何?
準確度取決於圖片品質。清晰、高解析度且使用標準字體的圖片通常可達到 95% 以上的準確率。手寫文字、低解析度或特殊字體可能降低準確度。
可以從手寫文字中提取文字嗎?
Tesseract.js 主要針對印刷文字訓練。手寫辨識能力有限,效果通常較差——尤其是草書。對於手寫文字,像 Google Vision API 這樣的專用服務效果會好得多。
可以同時處理多張圖片嗎?
可以。您可以一次上傳多張圖片。工具會依序處理並將所有提取的文字輸出在單一結果中,每張圖片的文字都有清楚標示。您可以複製合併的文字或下載為 .txt 檔案。
切換語言時會發生什麼?
首次選擇新語言時,Tesseract.js 會下載對應的語言資料檔(通常每種語言 2-15MB,首次使用後快取)。英文始終預載,無需額外下載。處理時間因語言複雜度而異。
為什麼首次 OCR 運行較慢?
OCR 引擎和所選語言資料在首次使用時下載並快取在瀏覽器中。同一工作階段中的後續運行會快得多。進度條和狀態文字顯示初始化期間的進度。

Coda One 的 OCR 工具使用 Tesseract.js 從圖片中提取文字,完全透過 WebAssembly 在瀏覽器中運行。支援 100 多種語言。上傳截圖、文件照片或掃描頁面即可立即獲得可編輯的文字。無伺服器處理、無需上傳。免費且無限制。

More:  所有圖片工具  · Compress  · Convert  · Resize  · Remove BG