X



ScanSnapシリーズ総合スレ Part39 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2016/10/09(日) 20:14:51.95ID:7wdHg9E7
■公式
富士通 http://scansnap.fujitsu.com/jp/
PFU . http://www.pfu.fujitsu.com/imaging/index.html
現行製品 http://scansnap.fujitsu.com/jp/product/
過去機種 http://scansnap.fujitsu.com/jp/archive/

■ニュース・レビュー・参考リンクなど
ITmedia > ScanSnap
http://www.itmedia.co.jp/keywords/scansnap.html
マイコミジャーナル > ScanSnap
http://journal.mycom.co.jp/tag/0001909/
日経トレンディネット > ScanSnap
http://trendy.nikkeibp.co.jp/bns/bnsearch.jsp?BID=2632&;amp;OFFSET=0&SEARCH_TEXT=ScanSnap
PC Watch > 槻ノ木隆のPC実験室
http://pc.watch.impress.co.jp/docs/article/backno/pclabo.htm
PFUのScanSnap徹底レビュー&活用レポート
http://ascii.jp/ad/scansnap/

自炊技術 Wiki
http://wikiwiki.jp/bookjisui/

■前スレ
ScanSnapシリーズ総合スレ Part38 [転載禁止]
http://tamae.2ch.net/test/read.cgi/printer/1448688789/
0780名無しさん@お腹いっぱい。
垢版 |
2017/11/03(金) 21:26:58.09ID:2nt7P5fG
まえに書き込んでいた人がいましたが、
トラブルで読み取りが停止した時にでてくる
「ここまで読み取りました」というページの画像が
あまりにも小さく劣悪なので、これをもうすこし
解像度のあるものにしてほしいですね。
ページ番号さえも読めないことが多い。
「画像」としての特徴のない文字だけのページ
だと同定が難しい。
緊急停止ボタンより有用な改善だと思います。

読み取りが停止した段階で、一度保存し、
それを開いて最後のページとその前のページを
確認して、そのPDFファイルの名前の末尾に
「1」と番号をつけて、つづきから別のファイルとして
スキャンしています。あとでPDF編集ソフトで結合
します。ページの欠落が怖いので。
0781名無しさん@お腹いっぱい。
垢版 |
2017/11/03(金) 21:35:38.62ID:ura2UGwi
>>「ここまで読み取りました」というページの画像が
そーとーレアなケースだと思うけど
500冊に1件も見ていない

>>あまりにも小さく劣悪なので、これをもうすこし
拡大できなかったっけ?以前は出来てたと思うけど
あと、保存されたのを別ビュアーで確認でも行けると思うが

ああ、PDFの人特有の話なのかな?
JpgからPDFへあとから変換じゃダメなの
というか、PDFってビューアーあんまし良くないじゃん
0782名無しさん@お腹いっぱい。
垢版 |
2017/11/03(金) 22:36:25.11ID:OdrxkXTy
>>780
あれ見づらいよね。
ジャムで停止した時は片面しか見せてくれなかったりして
その面が白紙だと情報ほぼゼロってことも。

>>781
>500冊に1件も見ていない
マジか…
重送とかジャムとかで停止して「ここまで読んだ」になるケース、
うちのS1500だと5回に1回ぐらいはある気がする。
状態の悪い原稿だと数ページごとになってしまって
「もうこれ一枚ずつ手差ししたほうがいいんじゃ?」と思うことも。

>というか、PDFってビューアーあんまし良くないじゃん
Macだと純正のプレビュー.appで結構快適に見えるんで
最初からまとまってくれるPDFが便利なのです。
0783名無しさん@お腹いっぱい。
垢版 |
2017/11/03(金) 23:06:53.57ID:JicEF3yh
>>780
そうそう
あと、スキャン後のファイル名を入力するときに、最初のページを大きく表示してほしい
最初のページには会議の名前や日付というファイル名に入力する情報が書いてあるから
0784名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 05:51:36.20ID:6ZJP81h+
>500冊に1件も見ていない

「ここまで読み取りました」ってエラーメッセージは確かに見てないけど
最後に読み取ったプレビューというかサムネイルの画像のことだと思うよ
0785名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 14:46:39.00ID:t02JITZx
仮に長い巻物みたいな紙があったとする。
ScanSnapにそれを読み取らせると
永遠と読み続けるだろうか?

もちろんそんなことはしない。
途中で打ち切る。

それが「ここまで読み取りました」

つまりA4用紙が1枚ずつ吸い込まれず
1枚の途中で2枚目を吸い込むなど
1枚を超える長さを読み取った時に出るエラーなのさ
0786名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 14:51:46.52ID:6ZJP81h+
すげぇ。長い紙があったらやってみる。
むかーしエプソンで長いロール紙対応のプリンタがあったなぁ。大型SCに消される前に商店街のパノラマ写真を作った。
0787名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 15:06:00.99ID:Fm/AIDqq
>>783
これ、分かるわ
0790名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 20:18:51.83ID:6ZJP81h+
長尺読取863mmまでだそうです。長いような短いような。
表と裏で繋げばメビウスの宇宙を越えるかもしれないと思ったんだけどなぁ。
0791名無しさん@お腹いっぱい。
垢版 |
2017/11/04(土) 20:19:46.13ID:kNKbvLFj
>>780
です。
混乱させて申し訳ありません。
「」で囲った文章は画面にはでてきません。
でません。
そのような「意味」の画面になる、という意味でした。
みなさん同じようなところで悩んでますね。

私は、あまりあの表示画面に期待してません。
トラブルが起きた時点で、そのスキャンは中断して、
出来た分だけ保存して続きを別のファイルで
スキャンします。
あとで結合。スキャンはWindows、加工はMacです。
====たとえば============
2017年11月04日22時45分14秒.pdf
という途中までのファイルが保存されたら、
2017年11月04日22時45分14秒1.pdf
と名前を変更します。
この次の年月日時分秒のファイルは、その”秒1”で
終わっているファイルの続きだと理解します。
再度トラブルが起きたら(ほとんどない)、
2017年11月04日22時46分27秒2.pdf
と次のファイル名を変更する。
こうして、
2017年11月04日22時45分14秒1.pdf
2017年11月04日22時46分27秒2.pdf
2017年11月04日22時48分02秒.pdf
の3つのファイルが1つの書籍(など)を
構成する、という意味になります。
0792名無しさん@お腹いっぱい。
垢版 |
2017/11/05(日) 09:23:51.50ID:DCo30J0n
アプリ画像は最初から当てにしてないんだよなぁ。アプリ自体の信頼性もイマイチ。
そもそも目の前にスキャン原稿とスキャン済み画像があるわけでそれを信じるしかない。

JPG保存(スーパーファイン)にしてファイル名は連番3桁のみ、サムネアイコンを最大にしる
保存先を「名称未設定フォルダ」にしてスキャン後に[出版社・著者] タイトル 第xx巻(年)(価格).zip

PDFにするくらいだったら本のままの方がマシ
0794名無しさん@お腹いっぱい。
垢版 |
2017/11/05(日) 10:12:54.25ID:DCo30J0n
人類にPDFはまだ早すぎるんだよ

印刷ファイルの保存だけならいいんだけど、読みたい場合にはいちいちファイル全部を読み込んでから
その後に演算しながらの表示になるし、他の形式へ変換は手間と速度と品質で現実的ではないし、
読み取りノイズの編集もそう簡単ではない。セキュリティ問題でバージョンアップも頻繁。
イラレで作ったデータを後年に残すためにしか使ってない。
0795名無しさん@お腹いっぱい。
垢版 |
2017/11/05(日) 22:10:44.72ID:yAhycYIp
ビジネス用だとPDF保存が良い
OCRで文字データを付けておけば、議事の名前の一部や担当者で検索できる
利用の分野の違いで保存形式も変わるのだろうな

>>783の話は、スキャナのそばに古紙回収箱があるから、画面で1ページが読めれば、PCの前まで持ち帰らなくて済むということなんだ
0801名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 12:57:24.22ID:8rl+VCD8
実際使った人が書かないと意味無いよ

OCRは誤字脱字がヒドくて使い物にならんのよ
それを前提にしてくれ
0802名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 13:08:22.13ID:hoy/h/so
前提は紙の文書をスキャンするというところでしょ
元文書データが手元にあったり人力テキストおこしに時間を割くという前提ではない

OCRは全文検索用に無いよりはあったほうがいいという代物
紙のままでは検索自体できないのだから
0803名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 13:09:07.10ID:7rW4/EJP
>>801
OCRは検索用途だとそこそこ使えるんで重宝してるよ。
認識後のテキストだけ取り出して読めると期待してたらガッカリするかもだけど。
0804名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 13:22:45.06ID:8rl+VCD8
いや名刺のゴシック体検索にも使えないよ
電話番号やアルファベットなら十分だけど仕事で使うなんて怖すぎる
0806名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 14:05:00.19ID:hoy/h/so
だからテキストとして活用するもんじゃなく検索用だと言ってるのに

ていうかゴシックの名刺とかやる前から駄目なの分かってる物はOCRかけんじゃろ
0807名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 19:04:56.66ID:9w0aYF5T
>>804
名刺はOCRしてチェックして手で訂正する
さすがにそのままでは不安だし、実際間違いがある
CardMinderお使ってる
0808名無しさん@お腹いっぱい。
垢版 |
2017/11/07(火) 23:29:07.46ID:8qt/9UUe
>>806
スキャンを実際に「使っている」人の意見だ。
ノーマルな意見だと思う。
PDFを使う人にとってはね。

OCRしたPDFに「完全なテキストファイル」を求める
のはナイーブ(英語の本来の意味で)w
それでも、ゼロから入力するより、OCR結果を参考にするほうが
はるかにまし。
0809名無しさん@お腹いっぱい。
垢版 |
2017/11/08(水) 00:18:13.88ID:uy5plW47
公文書のOCRも結局係員が全部見直して訂正しまくってたり最初から使わなかったりだ
マークシートもほんのちょっとした汚れや鉛筆の粉で反応してしまうから、合格ライン付近は全部見直ししてる

青空文庫とかも全部手入力だもんね
OCRはまだまだ使い物にならない
0810名無しさん@お腹いっぱい。
垢版 |
2017/11/08(水) 01:29:15.22ID:fw+2ydgz
OCRで画像から電子ドキュメントにってのは結局時間がかかるだけに終わることが多い
句読点や記号、半角全角、Oと0とか詳細チェックを何度もやらないと完璧にならない
不自然な文字を的確に判断できるAIでもあればまた進化できるのかな?
現時点では全部打ち直した方が結果的にも速い

OCRはざっくりとテキスト化させるというくらいでちょうどいい
それをざっくりと使うという感じで
検索用にとかそんなレベルで使うのが実情だろうな
0812名無しさん@お腹いっぱい。
垢版 |
2017/11/08(水) 15:53:23.14ID:AmQ0xbIh
OCRからの手修正でしょ>青空文庫
ttp://www.aozora.gr.jp/aozora-manual/index-input.html

自炊本で文字系の本は全部OCRしてPDFだわ。自分で読むだけだから修正はしないけど(透明テキストなら修正する必要も感じない)
検索できるのは便利だし、ハイライト引いたりも出来るしね。ハイライトした部分に飛べるから便利。
OCR関係ないけどPDFは目次も付けられるし。

OCRに完璧求める人は、透明テキストPDFでなく、完全に文字に起こして青空形式なり、epub形式なりにしてんだろうか
0814名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 16:02:00.55ID:xEDPmxLF
とりあえずJPGでとっとけば、後からOCRでテキスト化、PDFにもできるけど
「検索に使える精度と信頼性は無い」からテキスト化PDF化は無意味だよ。
0815名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 16:07:36.53ID:2wKFGyGV
OCRの技術は、これからどんどん進歩するだろう。
しかし、大多数の利用者にその進歩の需要があるかどうか?
いまでもかなりの精度だから。
それでも、改善はなされていくだろう。
古文書の手書き文字さえ認識されるんだから。

500ページの書籍をスキャンして、それに検索可能な
テキストをかぶせてPDF化するというのが、すごく
便利。本文中を自由に検索できるからね。
検索していると、検索用語がどのページに集中して
いるか?いくつ使われているか?どのような組み合わせ
で使われているか;「どのようなOCR誤読がなされているか」
を知ることができる。これは重要。
しかも、オリジナルの付図や表、式などとの位置関係を
崩すこと無く検索が可能だ。

PDFの利便性は、利用者の「頭の良さ」の問題だ。
0816名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 16:46:30.92ID:E4HVpmDI
OCRが検索に使える精度がないって元データが悪すぎるんでないの?
結構きちんと読み取るけどなあ
0817名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 16:48:01.69ID:7dsDxMWj
とりあえずPDFでとっとけばあとからJPG抽出もできるとも言える
取りこぼしがあってもアタリがつけられればOKな使い方する人なら無意味ではないだろう
画像ビューアで全ページ総なめで目視確認していくよりは楽だからな
0820名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 19:25:48.62ID:rZLKASDA
>>815
>OCRの技術は、これからどんどん進歩するだろう。

いやしねーだろ
そのセリフ何年前から言ってんだよ
もう長いこと1ミリも進歩してない
0821名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 20:24:46.54ID:xEDPmxLF
確かに10年以上前にスキャナ買ったときに付いてきた EPSONの読んde!!ココが一番使いやすくていいね
文庫本1冊で修正がまったく要らないこともある。

次点でe.Typist(ScanSnap SV600Aバンドル版、翻訳向き、iX500でも使える) 読取革命、DocuWorks
精度よりも出力がPDFや住所録にできるとかクラウド対応がメインならお勧め

Adobe Acrobatはバージョンアップを重ねるほど肥大化・劣化してるんで論外
古いバージョンをたまにファイル形式の変換目的で使う程度かな
0822名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 21:28:59.40ID:2wKFGyGV
>>820
昔のと最近のOCR使ったことあるのか?w
大昔から時が止まってないか?
OCRエンジン 文字認識 AI 古文書
なんかの単語で検索してみよう。
検索単語は、OCRのほかに、「文字認識」な。
0825名無しさん@お腹いっぱい。
垢版 |
2017/11/09(木) 22:52:52.60ID:REMwE10q
iX500の「検索可能なPDFに変換」を使用してデータ化してみたが、
これだとまず100%の確率で
カタカナの"ト"は漢字の"卜"(ぼく)、
漢字の"日"(ひ)は"曰"(いわく)
に認識されるな。
これ以上の精度向上は、前後の文脈を判断する機能が付加されない限り
無理だと思う。
0827名無しさん@お腹いっぱい。
垢版 |
2017/11/10(金) 09:08:46.03ID:rCISXU51
>>825
OCRにも進化してもらいたいが、検索の方でも対応してほしいな
ト卜、日曰、とか斉斎齋を同一と見なして検索する機能が欲しい
0830名無しさん@お腹いっぱい。
垢版 |
2017/11/10(金) 16:21:28.58ID:23GpNKfl
つーか処理速度だな
いくらなんでも時間かかり過ぎ
CPUはマルチコア対応にしてメモリもりもり使っていいから処理速度上げてほしい
0834名無しさん@お腹いっぱい。
垢版 |
2017/11/11(土) 11:34:57.35ID:vZZWh0vC
仕事に使えないから住基ネットとかマイナンバー制度とかやりだしたんだよ

人類にPDFはまだ早すぎるんだよ(2回目)
OCRとPDFを混同してるIT弱者がPDFを薦めてくるのがその証拠だ
0836名無しさん@お腹いっぱい。
垢版 |
2017/11/11(土) 13:50:39.63ID:UIQvsqPI
PDF否定派 すでに妄想状態w まさに論理弱者
少しは PDFやOCRを実際に使ってみろよ。恥ずかしいw
そういう職種じゃないのかも知れんが
0837名無しさん@お腹いっぱい。
垢版 |
2017/11/11(土) 16:49:08.70ID:2XBqLVV8
というか人類なんて最大限にでかい主語を持ってきてる段階で聞く価値ないよなぁ。地球が何周回った時〜じゃないけど、お前は人類の何を知ってるんだっつうの。
0838名無しさん@お腹いっぱい。
垢版 |
2017/11/11(土) 18:44:39.54ID:JfYEgGf6
精度ガー君はOCRに求めすぎなんだと思うわ
精度低くても低いなりのテキトーな使い方すりゃそれなりに活用できるつってんのに

俺基準に満たないから全人類にとっても無意味って言い切っちゃうのはさすがに笑う
0841名無しさん@お腹いっぱい。
垢版 |
2017/11/12(日) 08:54:00.31ID:wxKVYK6q
最近OCR始めたばかりの子供があちこちで荒らしまくってるから
いつも問題起こしてるのは一人だよ
よっぽど感動したんだろうなぁ
0843名無しさん@お腹いっぱい。
垢版 |
2017/11/12(日) 14:12:16.62ID:qJbpEM+e
>>827
カと力
も忘れないでね。
0845名無しさん@お腹いっぱい。
垢版 |
2017/11/14(火) 17:58:12.82ID:s1M9f7QI
日本語と英語の両方をOCRするのって技術的に難しいの?
付属のソフトだと片方しか選べないんだけど…
0850名無しさん@お腹いっぱい。
垢版 |
2017/11/17(金) 22:31:02.28ID:nl/481FF
たとえば、
海外のオンラインOCRを使ってみると
https://www.onlineocr.net/

ネットの画面をキャプチャしたファイル(PNG)を
上記のサイトにアップロードして読み取らせる。
出力はplain textに設定。MS Wordなどのファイルとしても
出力可能。

↓これを日本語と設定して読み取ると;
https://i.imgur.com/MduRspP.png
↓こうなる;
https://i.imgur.com/k5ZVe5K.png

OCRで出てくるテキストファイルは改行なし、になる。
日本語の文字の間に半角スペースが入ることがあるようですな。
このOCRエンジンでは。
0851名無しさん@お腹いっぱい。
垢版 |
2017/11/21(火) 17:45:34.49ID:F2p4Erl8
スキャンすると「キュルキュル」音が出るようになったんだけど、何が原因だろう?
紙質の問題?
0854名無しさん@お腹いっぱい。
垢版 |
2017/11/21(火) 21:32:43.93ID:oBPbWwEd
裁断されて捨てられていった書籍たちの『呪怨』ですね。
気をつけてください。夜、給紙カバーを持ち上げて出てきますから。
0855名無しさん@お腹いっぱい。
垢版 |
2017/11/21(火) 22:15:36.18ID:FJL6Stur
薄いツルツルのカラーページをスキャンする時なんかはキュルキュルいうから紙質の問題では?
0857名無しさん@お腹いっぱい。
垢版 |
2017/11/22(水) 10:22:24.16ID:7ek3CubO
>>851
紙質の問題かと。

ほかの種類の紙をスキャンしても、同じ音がしますか?
各種ローラーを清掃しても、同じ紙をスキャンしたら
同じ音がしますか?
0860名無しさん@お腹いっぱい。
垢版 |
2017/11/25(土) 01:21:28.64ID:N9tMhNX+
富士通は、パソコン工場を島根県にだけ持っている(島根富士通、大規模らしいけど)。
それに対して、PFUは、スキャナの工場を、中国とインドネシアと日本に持っているという。(小規模かもしれないけど)
http://www.fujitsu.com/jp/microsite/scanner/quality/control/02.html
これは、やはりPFUが、他社OEMでもスキャナを作っていて「圧倒的優位」に立っているということなのですか?
(将来はレノボブランドでもスキャナー作ったりして???)
0865名無しさん@お腹いっぱい。
垢版 |
2017/12/05(火) 11:17:54.41ID:aJe3xuqb
s1500で消えない縦線が出てきたんでそろそろ買い替えようかと久々に公式へ行ったが
7年経ってもあまり進歩してないね

Acrobatが付かなくなって変なソフトが添付されるようになったし・・・

縦線をAIで消すドライバソフトウェアを早く開発して欲しいわ
0873名無しさん@お腹いっぱい。
垢版 |
2017/12/06(水) 06:57:36.69ID:w8M8JY8L
>>867
High Sierraで問題なく動いてるように思うが、対応してないんか
0875名無しさん@お腹いっぱい。
垢版 |
2017/12/06(水) 16:50:23.81ID:pVTUcJQl
>>872

> >865の縦線除去機能も付いてるて前にどっかのスレで聞いたが未確認

まじで?
公式見たが確認出来なかった
0877名無しさん@お腹いっぱい。
垢版 |
2017/12/08(金) 01:16:34.80ID:zE70vw44
ツルツルの雑誌の取り込みでジャムが頻発する
濡れた雑巾でページの真ん中をさっとなぞってやったらジャムが発生しなくてワロタ
0878名無しさん@お腹いっぱい。
垢版 |
2017/12/08(金) 01:19:13.15ID:MXqDPUAm
紙送りの黒い大型ローラーが滑っていますね。
そのローラーだけを水で湿らせてやってもいくらかもちます。
なぞるにはウェットティシュもいいですよ。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況