ScanSnapシリーズ総合スレ Part39 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
メールアドレス変えて登録すれば何度も利用できないか? >>452
でもま、どっかの調節でサッとできる訳じゃないのね、
ならいいや、諦めも肝心 白黒飛ばしとシャープネス(毎回同じ)の簡易調整ぐらいするな
コミック、小説、専門書(文字多図小)ではほぼ満足
それでも満足できない本は確かにある(コンピューター関連の網掛けw)が
かける時間の割に、メリットが少ないんで諦める 被写体深度ボケのことを言ってるならADFとCISはむしろ相性いいほうかと
センサに紙がぴったり付く構造にしさえすればCISは高精細な画が取れる
(IX500の場合はCCDのS1500やfi並に押さえてあるらしくDRほどシャープな画ではないが)
色味についてはくすみがちなCISの欠点をビビットな色補正で回避してる
オリジナルと近い色かどうかは微妙、まあS1500も対して正確ではなかったが
CCDに比べて網点は目立ってしまうため600以外はモアレ除去用にかなり強補正かかってる
等倍で見ると所々溶けてたりブツブツしてるのがわかる SV600かIX500を文書の電子化のための読み取りにご使用でOCR処理をかける方がおられたら、ご教示ください。
大手業者に頼むと、電子化とOCR処理にはA4サイズで1枚あたり90円かかるそうで、OCR読み取り精度は95%程度だとのこと。
そこで質問です。
SV600やIX500では、OCR読み取り精度はどのくらいになるでしょうか?
時間はかかってもいいのですが大量の紙文書を電子化する必要が出てきたため、
SV600やIX500を購入して自力でゆっくりやっていくか、業者に頼むかと迷っており、
OCR読み取り精度が同程度か少し劣る程度なら、スキャナーを購入して自力でやろうとおもっています。 素朴な疑問だけど外注を検討するほど量のあるOCR化の検収ってどうやるんだろう。 複数の人間によるチームがすべてを読んでいきます
10年かかってもかまわないので OCRは期待するな
Acrobatのやつ使ったことあるけど
改行はそのままで、改行またぐと検索出来ないし
理系関連だと、添え字とか無理だし図番とかどうやって
認識するんだと
95%なんて、テキスト中心でそれなりにいい条件なら
あっても不思議じゃないけど
期待するのは、今の技術では無理 OCRの精度は現行状態やレイアウトに左右されるのでなんとも言い難いが
業者でも自力でもあまり期待できないという意味では差は少ない
95%って100文字毎に5文字誤認してるということなので
(レイアウトや書体によっては1文字たりとも合ってないページなんかも出てくる)
ただエンジンによって得手不得手はあると思う
バンドル変わる前のPFUドライバ組込のOCRは他スキャナメーカー製のものに比べ
縦書きが猛烈に不得手だった記憶
今のはどうかわからないが場合によっては有償のOCRソフトを別途購入したほうが
多少は効率は上がるかもしれない >>466-467
丁寧なご教示ありがとうございます、助かります。
そもそも現在のOCR技術による処理の精度は高くないからたとえ業者の手によっても期待すべきではなく、
場合によっては有償ソフトを購入したほうが少しマシになるかもしれない、ということですね。
電子化する大量の文献は昭和初期から平成年間にかけてのもので、歴史的価値をもち、内容を精査する必要があるため、電子化後に原本と比較しつつ一字一句を読んでいくことになります。
ですから、自力でスキャンし、有償ソフトでOCR処理(やはりそれが為されていれば便利ですから)して、精読しつつ修正をかけるのがよいようにおもわれてきました。
ありがとうございます。
もう一つお伺いしたいことが。
SV600から直接読み取るか、いったんコピーを取ってからIE500にて読み取るか、迷っています。
というのは、SV600だとコピー取らないで済むのでラクですが、読み取り部と資料が離れているので、文字の解像感に問題が出そうな気がするからです。
SV600で平気でしょうか、それとも後々やOCR処理の精度のことも考えてより高解像度だろうと思われるIE500にすべきでしょうか。 どうやっても読み取り部が離れているSV600では解像度が下がるはずですし、
また資料の価値や取り直しする可能性を考慮すればコピーがあったほうがいいはずなので、
コピーしてIE500にかけようと思っています。ただ、コピーとる手間と、コピー保存の手間が… 以前業務で過去のマニュアルOCR処理して作り直しとかしたことあるけど
結局は微妙な間違い(Oと0、lと1みたいな)のチェックにやたら時間がかかったな
しかも後から後から間違いが発覚して
結局業者に打ち込み頼んだ方が早く安くすんだかもしれない 最近のAIやらディープラーニングやらで次世代のOCRが出てきそうなもんだけど(適当) ろくに仕組みの知れてもいないものに過渡に期待するのは無責任な愚衆の典型ってこと とりあえずOCR精度の話したいならOCR板のが向いてるのでは 読取革命の遅さったらない
i7-6700メモリDDR4の16Gでやっても一冊1時間以上かかる
マルチコアで処理できないのかね、あれ 10年かかってもよくて一字一句確認するなら10文字通り1円とかでバイト軍団を3年ほど編成したほうがいいんでないかな。 >>470-475
回答ありがとうございます。
OCRのスレも読んできました。
このところKindleや、英語の論文を読む機会が多く、電子化は革命的に容易になったのかなと思い込んでいましたが、
少なくともOCRソフトによる日本語の読み取りはまだまだ難しいようですね。
複数のアルバイトによる逐次的処理の方が確実で安くあがるかもしれません。
これはスキャナーを買ってきていろいろ試してみること、
読み取り用のコピーは当面(10年くらいか?)とっておいて革命的な進歩があったらまた読み取ること、が最善であるように思われます。
ご教示ありがとうございました。 海外旅行のガイド本(ずばり「地球の歩き方」です)をスキャンしてスマホで見れるようにしたいんですが、簡単にスキャンできる機械ってありますか?
3年前の時点で調べたらまだ1ページことのスキャン時間が数10〜1分くらいかかるし
1ページごとに本を台にセットしないといけないし面倒だったけど今なら自動化してたりするのかな?
「スキャンスナップ」は実に多種多様なものがありますが
本のいろんなページをひらいたままスキャンしてWordに貼りつけまたは画像ファイルとして保存して
あとでスマホで見る用途に適した機械で激安なもの、みたいなオススメありますでしょうか?
裁断はしたくないけど画質が全然違うなら検討します。
上にカメラみたいなのを固定して写真を撮るタイプのスキャンスナップがあるけど、これ画質は悪くならないんでしょうかね。
スマホアプリでそういう機能のアプリがあると聞いて試したけど画質が満足するものではありませんでした。 海外製品ではINDIEGOGOの「PUP」という製品がすごく評判よいようですが、どうでしょうか?
たしかに手軽にスキャンできそうだけどこういう非接触系は画質が心配。
あといい製品だったとしてどうやって日本から購入できるのでしょうか?
https://japan.cnet.com/article/35092722/
http://tabi-labo.com/279153/pup-pocket-scanner ScanSnapのラインナップは5種のみで現行機種も3年前からならたぶん変動してないが
他メーカー品の話題はここでは取り扱ってないので本の取り込みスレか自炊技術総合かどうそ
完成するかどうかも分からんクラウドファンディング品の品質や購入方法をここで聞かれても困る 非破壊系ならsv600
ただ専用非破壊読み取りスキャナ使うくらいならスマホの撮影アプリなりデジカメなりコンビニスキャナやフラベスキャンでいいと思う
後半は知らん、少なくともここできくことじゃない >>480
何冊必要なのか知らんけど
電子版買ったほうがいい案件な気が ScanSnap iX500で、B5の漫画雑誌をスキャンしています
排出した紙がきれいに重ねたいのですが、どれだけ傾斜台を工夫してもぐちゃぐちゃになってしまいます
良い方法をご存じないでしょうか スキャン後の紙が
机の引き出しに落ちるようにセットするといい
>>490
それどうやった?
文字
>>488
出てきたスキャン済みの紙を受けるトレイの一番手前のところに、重いオモリを
置いて、そこで紙が次の紙に押されて移動しないように紙をせき止める。
オモリはトレイではなく、その外側(こちら側?)に置くこと。
わかるかな。
上から見た図です。
http://i.imgur.com/marbDCU.png >>493
この場合、トレイよりも手前にスキャン済みの紙が出てくることが必要です。
軽いオモリであれば、トレイの上の適切な場所に置いておいて紙の余計な動きを
制約することも可能ですが、重すぎないように。トレイがとれる。 S1300iだけど吐き出した先にコの字型に濡れタオル置いてる
指も濡らせる IX500にトレイなんてあったっけ?
俺ストッパー代わりにインスタントコーヒーのビン置いてるわ トレイ出さずに>>493みたいにやってるけど
トレイわざわざ出すメリット何? 質問者が揃えたいっていってるからでは?
漫画雑誌だと紙質的に揃えるのは辛い
上質紙使うコピー機でも揃えるときは
機械的にがしょんがしょんしてるから
諦めてあとから分けてトントンするしかないんじゃないかな 昔このスレでトレイ出せるの知らずにそのまま床にドバドバ落としてて
勢いで四方にちってページばらばらになるって嘆いてた奴がいたな
今回もそんなオチな悪寒 トレイ出せるの知らなかった
vs
トレイ出さずに使えるの知らなかった
なの? 小説とかだとあるな
紙質でうまく排出出来ないこと
言葉でうまく説明しづらいんだけど
1枚スキャン完了=>排出=>排出口のブラシっぽいとこに引っかかる
=>次ページの排出が前のページの下(1枚下とは限らない)で引っかかったやつが
同時に排出される
が繰り返されるため、結構ランダムになること 日にちが経つとファイルが自動削除されるscansnap folderってどれのこと?
organaizerで左のツリーの青赤のScanSnap以下につくったフォルダ全部削除されるの? どうだろう、友人がこないだS1500からiX500に乗り換えて、早い!ノーストレス!OCRで待たない!て喜んでいるが、いま新型きたらショックだろうな スマホやPCみたいに業界同行から類推できないから読みづらいよね。 まあ特定機種やメーカーにだけ興味あるならそこだけ見てればあるていどは…
だめかな。 ふむふむ。
S1500からiX500ってどんくらい開いたんだっけか。 まだS1500現役だわ
なぜかSV600もいるんだが… ないわ
元々メジャーUPは4年に一回くらいのスパンだぞ
IX500発売からはもっと経ってるけどな いいとこ
プレビューがでかい 原寸以上
裏写り除去が便利
ガバッと開いて掃除しやすい
スキャナが熱くならずノリこびりつきにくい
よくないとこ
読み込み後の保存に時間がかなりかかる
やっぱでかい
職場の机に置いてるけどオサレじゃなくなった
こんな感じ >>517
取り込みに時間がかかる?
USB3.0になってますかね ix500使ってるが、プレビューが小さいよな
何ページで読み取り失敗したのか読めない
あと保存するファイル名を入力する時に1ページ目をプレビューしたい
1枚目に書いてある会議の日付と名前をファイル名にしたいから 毎分20枚でいいからエクセレントとスーパーファインの間のdpi読み取りが欲しい 自力で交換できない部分のローラーだけ交換できないか電話したら、もうサポート対象外だって言われて捨てた…
ローラーが逝く直前まで画像はそれなりにスキャン出来てたので割と無念 >>522
すまん、もう捨てちゃったから型番確認出来ない… >>519
>ix500使ってるが、プレビューが小さいよな
>何ページで読み取り失敗したのか読めない
同意!
不安なので、ここで一度中断してそれまでの分を保存して、
そのPDFを開いて最後のページを確認して、その次ページからあらたにスキャンを
初めて、結局その前後2つ(3つになることも:(泣))のPDFをあとで編集ソフト
で結合させることもあります。
手間ですが、あとで分かるように末尾に適当な番号・記号を付けます。 うっわ また、センサー内部に入ったごみによる縦線発生だよ
3年間で3度目(内ひどいのは2度)
一応完全ではないものの、袋かぶせてるんだけど
偶奇2回に分けてスキャンするか、修理に出すか迷いどころ
(さしあたって後3冊なんでw) >>525
解像度が低くて読めない画像を拡大しても読めないよ そこをdeep learningでだな
しかしアレ、たしかに顔っぽくはなってるけど
元画像とは違う顔に見えるよね 新しいの出てこないから
エプソンの570Wを買ったよ >>531
scansnap1300からの買い替えだから参考にならないだろうが全体的に満足
不満点は給紙枚数(公称50枚)で、
一般的には無理すればそれ以上もさせるもんだけど、
570Wに関しては、紙抑えのバーに突起のようなものがあって、物理的に入らなくなってた。
力技でもぎ取れると思うが。。 >>533
無意味とは思わないがそれほどの必要性がわからなかったよ。
ix500にも、570Wの上位の580Nにもついてないし。。
まぁ些細な不満点。
http://2ch-dc.net/v7/src/1496756411513.jpg >>534
ああ、確かに見た目いらなそう
常識的に考えれば、用紙枚数というか、厚さの制限で
誤って一度に全部の紙を取り込むと機械にダメージをあたえるとか
>不満点は給紙枚数(公称50枚)で、
と言ってるぐらいだから、無理するんだろ >>537
Android版CCで使えるAcrobatの標準機能だよそれ >>537
使ってみた。
うん、まあ、なんというか・・・
改善の余地はあるでしょうね
OCRはちょっとね
スマホをきちんと固定してやるとちがうのだろうけど まぁ、スマホだと解像度が限られるんで
追いつくことは無いんだろうけど
文字認識+サイズ+フォントまで認識出来たら
小説とかならいけそう
図番とか、写真とか、背景とかはどーしようもないけどな スマホ使ったことない人かな?
バス停の時刻表撮っただけでも
はじっことかもう読めないよ いちいちスマホ構えてピント合わせたりとかの手間を考えると専用機は必要
ただ手軽さとかが上なのはいうまでもないから使い分けしたらいいんじゃないかな
機能比較はしても同じ使用方法での優劣つける必要はないだろ >>545
電車やバスの時刻表とか、文字書かれている案内とか撮っても問題なく読めるけど。 >>545
カメラの解像度は機種によって差があるよ。
手ブレ補正とかも付いてるやつあるし。 >>545
それピントが中央にしかあってないからで解像度とは別問題だよ
SV600が首振りタイプなのもピントボケ防止対策だしな
昔CamScanarで蔵書理リスト用の表紙撮りをしようとしたことあったけど手持ちで連続パシャ撮りは大変だったわ
3脚使っても照明とピント合わせ難しいし結局フラベで150dpiスキャンのほうが楽じゃねという結論に
出先で数枚程度を手軽にPDF化するのにはいいんだけどね >>545
そのスマホは買い替えたほうがいいです。
iPhoneで問題なくこまかいところまでよめます
実用十分
語学辞書のページもOK >>545
なん年前のスマホを使ってるんだよwww ディープラーニングに食わせて意味があるぐらいのパターンを網羅した質量の縦線画像を準備すれば。 >>545
今もうA4とかでも普通に隅まで撮して、さらにアプリで歪み直してPDFにすること出来るよ ■ このスレッドは過去ログ倉庫に格納されています