ScanSnapシリーズ総合スレ Part39 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
すげぇ。長い紙があったらやってみる。
むかーしエプソンで長いロール紙対応のプリンタがあったなぁ。大型SCに消される前に商店街のパノラマ写真を作った。 長い紙読んでる途中で上と下くっつけたらどうなるんだろw 長尺読取863mmまでだそうです。長いような短いような。
表と裏で繋げばメビウスの宇宙を越えるかもしれないと思ったんだけどなぁ。 >>780
です。
混乱させて申し訳ありません。
「」で囲った文章は画面にはでてきません。
でません。
そのような「意味」の画面になる、という意味でした。
みなさん同じようなところで悩んでますね。
私は、あまりあの表示画面に期待してません。
トラブルが起きた時点で、そのスキャンは中断して、
出来た分だけ保存して続きを別のファイルで
スキャンします。
あとで結合。スキャンはWindows、加工はMacです。
====たとえば============
2017年11月04日22時45分14秒.pdf
という途中までのファイルが保存されたら、
2017年11月04日22時45分14秒1.pdf
と名前を変更します。
この次の年月日時分秒のファイルは、その”秒1”で
終わっているファイルの続きだと理解します。
再度トラブルが起きたら(ほとんどない)、
2017年11月04日22時46分27秒2.pdf
と次のファイル名を変更する。
こうして、
2017年11月04日22時45分14秒1.pdf
2017年11月04日22時46分27秒2.pdf
2017年11月04日22時48分02秒.pdf
の3つのファイルが1つの書籍(など)を
構成する、という意味になります。 アプリ画像は最初から当てにしてないんだよなぁ。アプリ自体の信頼性もイマイチ。
そもそも目の前にスキャン原稿とスキャン済み画像があるわけでそれを信じるしかない。
JPG保存(スーパーファイン)にしてファイル名は連番3桁のみ、サムネアイコンを最大にしる
保存先を「名称未設定フォルダ」にしてスキャン後に[出版社・著者] タイトル 第xx巻(年)(価格).zip
PDFにするくらいだったら本のままの方がマシ 人類にPDFはまだ早すぎるんだよ
印刷ファイルの保存だけならいいんだけど、読みたい場合にはいちいちファイル全部を読み込んでから
その後に演算しながらの表示になるし、他の形式へ変換は手間と速度と品質で現実的ではないし、
読み取りノイズの編集もそう簡単ではない。セキュリティ問題でバージョンアップも頻繁。
イラレで作ったデータを後年に残すためにしか使ってない。 ビジネス用だとPDF保存が良い
OCRで文字データを付けておけば、議事の名前の一部や担当者で検索できる
利用の分野の違いで保存形式も変わるのだろうな
>>783の話は、スキャナのそばに古紙回収箱があるから、画面で1ページが読めれば、PCの前まで持ち帰らなくて済むということなんだ 古臭い話ですなぁ
文字データもOCRとは非効率すぎる
そんな会社すぐ潰れるぞ 元データが手に入るならScanSnap要らないような >>796くらい頭が悪いと当初の目的もわからなくなるという好例 実際使った人が書かないと意味無いよ
OCRは誤字脱字がヒドくて使い物にならんのよ
それを前提にしてくれ 前提は紙の文書をスキャンするというところでしょ
元文書データが手元にあったり人力テキストおこしに時間を割くという前提ではない
OCRは全文検索用に無いよりはあったほうがいいという代物
紙のままでは検索自体できないのだから >>801
OCRは検索用途だとそこそこ使えるんで重宝してるよ。
認識後のテキストだけ取り出して読めると期待してたらガッカリするかもだけど。 いや名刺のゴシック体検索にも使えないよ
電話番号やアルファベットなら十分だけど仕事で使うなんて怖すぎる OCRは使う人を選ぶからなあ
下手だといつまでも活用できないよね だからテキストとして活用するもんじゃなく検索用だと言ってるのに
ていうかゴシックの名刺とかやる前から駄目なの分かってる物はOCRかけんじゃろ >>804
名刺はOCRしてチェックして手で訂正する
さすがにそのままでは不安だし、実際間違いがある
CardMinderお使ってる >>806
スキャンを実際に「使っている」人の意見だ。
ノーマルな意見だと思う。
PDFを使う人にとってはね。
OCRしたPDFに「完全なテキストファイル」を求める
のはナイーブ(英語の本来の意味で)w
それでも、ゼロから入力するより、OCR結果を参考にするほうが
はるかにまし。 公文書のOCRも結局係員が全部見直して訂正しまくってたり最初から使わなかったりだ
マークシートもほんのちょっとした汚れや鉛筆の粉で反応してしまうから、合格ライン付近は全部見直ししてる
青空文庫とかも全部手入力だもんね
OCRはまだまだ使い物にならない OCRで画像から電子ドキュメントにってのは結局時間がかかるだけに終わることが多い
句読点や記号、半角全角、Oと0とか詳細チェックを何度もやらないと完璧にならない
不自然な文字を的確に判断できるAIでもあればまた進化できるのかな?
現時点では全部打ち直した方が結果的にも速い
OCRはざっくりとテキスト化させるというくらいでちょうどいい
それをざっくりと使うという感じで
検索用にとかそんなレベルで使うのが実情だろうな >>778-779
オレ流ローラーカッターかと思った OCRからの手修正でしょ>青空文庫
ttp://www.aozora.gr.jp/aozora-manual/index-input.html
自炊本で文字系の本は全部OCRしてPDFだわ。自分で読むだけだから修正はしないけど(透明テキストなら修正する必要も感じない)
検索できるのは便利だし、ハイライト引いたりも出来るしね。ハイライトした部分に飛べるから便利。
OCR関係ないけどPDFは目次も付けられるし。
OCRに完璧求める人は、透明テキストPDFでなく、完全に文字に起こして青空形式なり、epub形式なりにしてんだろうか 検索はOCRしてEvernoteにPDFファイルをぶっ込んどく。これ最強。 とりあえずJPGでとっとけば、後からOCRでテキスト化、PDFにもできるけど
「検索に使える精度と信頼性は無い」からテキスト化PDF化は無意味だよ。 OCRの技術は、これからどんどん進歩するだろう。
しかし、大多数の利用者にその進歩の需要があるかどうか?
いまでもかなりの精度だから。
それでも、改善はなされていくだろう。
古文書の手書き文字さえ認識されるんだから。
500ページの書籍をスキャンして、それに検索可能な
テキストをかぶせてPDF化するというのが、すごく
便利。本文中を自由に検索できるからね。
検索していると、検索用語がどのページに集中して
いるか?いくつ使われているか?どのような組み合わせ
で使われているか;「どのようなOCR誤読がなされているか」
を知ることができる。これは重要。
しかも、オリジナルの付図や表、式などとの位置関係を
崩すこと無く検索が可能だ。
PDFの利便性は、利用者の「頭の良さ」の問題だ。 OCRが検索に使える精度がないって元データが悪すぎるんでないの?
結構きちんと読み取るけどなあ とりあえずPDFでとっとけばあとからJPG抽出もできるとも言える
取りこぼしがあってもアタリがつけられればOKな使い方する人なら無意味ではないだろう
画像ビューアで全ページ総なめで目視確認していくよりは楽だからな >>815
>OCRの技術は、これからどんどん進歩するだろう。
いやしねーだろ
そのセリフ何年前から言ってんだよ
もう長いこと1ミリも進歩してない 確かに10年以上前にスキャナ買ったときに付いてきた EPSONの読んde!!ココが一番使いやすくていいね
文庫本1冊で修正がまったく要らないこともある。
次点でe.Typist(ScanSnap SV600Aバンドル版、翻訳向き、iX500でも使える) 読取革命、DocuWorks
精度よりも出力がPDFや住所録にできるとかクラウド対応がメインならお勧め
Adobe Acrobatはバージョンアップを重ねるほど肥大化・劣化してるんで論外
古いバージョンをたまにファイル形式の変換目的で使う程度かな >>820
昔のと最近のOCR使ったことあるのか?w
大昔から時が止まってないか?
OCRエンジン 文字認識 AI 古文書
なんかの単語で検索してみよう。
検索単語は、OCRのほかに、「文字認識」な。 >>820
CAPTCHAのいたちごっことか随分進歩しとると思うぞ >>822
読取革命なんてバージョンアップしたってパッケージ変えてるだけじゃん
中身は何も変わりゃしない iX500の「検索可能なPDFに変換」を使用してデータ化してみたが、
これだとまず100%の確率で
カタカナの"ト"は漢字の"卜"(ぼく)、
漢字の"日"(ひ)は"曰"(いわく)
に認識されるな。
これ以上の精度向上は、前後の文脈を判断する機能が付加されない限り
無理だと思う。 >前後の文脈を判断する機能
Japanistとシナジー効果すれば・・・ >>825
OCRにも進化してもらいたいが、検索の方でも対応してほしいな
ト卜、日曰、とか斉斎齋を同一と見なして検索する機能が欲しい つーか処理速度だな
いくらなんでも時間かかり過ぎ
CPUはマルチコア対応にしてメモリもりもり使っていいから処理速度上げてほしい 仕事でOCRなんて他人の著作物を流用する違法名簿屋くらいしかやらんでしょ 仕事に使えないから住基ネットとかマイナンバー制度とかやりだしたんだよ
人類にPDFはまだ早すぎるんだよ(2回目)
OCRとPDFを混同してるIT弱者がPDFを薦めてくるのがその証拠だ 人類というか日本には、な
文字がアルファベット・欧文だとかなりの精度だよOCR PDF否定派 すでに妄想状態w まさに論理弱者
少しは PDFやOCRを実際に使ってみろよ。恥ずかしいw
そういう職種じゃないのかも知れんが というか人類なんて最大限にでかい主語を持ってきてる段階で聞く価値ないよなぁ。地球が何周回った時〜じゃないけど、お前は人類の何を知ってるんだっつうの。 精度ガー君はOCRに求めすぎなんだと思うわ
精度低くても低いなりのテキトーな使い方すりゃそれなりに活用できるつってんのに
俺基準に満たないから全人類にとっても無意味って言い切っちゃうのはさすがに笑う 話の流れからしてPDFとOCRの区別が付いてないのが凄い PDFなんてpostscriptの子供だろw
なんでOCRと同列で語られなかんねんw 最近OCR始めたばかりの子供があちこちで荒らしまくってるから
いつも問題起こしてるのは一人だよ
よっぽど感動したんだろうなぁ 精度ガー君はどうせスキャンしてるのコミックなんだろ >アルファベット・欧文だとかなりの精度
らしいけど、0OD 1Il 2Z 5S UV 辺りはどうやってるの? 日本語と英語の両方をOCRするのって技術的に難しいの?
付属のソフトだと片方しか選べないんだけど… >>845
日本語を選択した時
混在してた英語はどうなるの? たとえば、
海外のオンラインOCRを使ってみると
https://www.onlineocr.net/
ネットの画面をキャプチャしたファイル(PNG)を
上記のサイトにアップロードして読み取らせる。
出力はplain textに設定。MS Wordなどのファイルとしても
出力可能。
↓これを日本語と設定して読み取ると;
https://i.imgur.com/MduRspP.png
↓こうなる;
https://i.imgur.com/k5ZVe5K.png
OCRで出てくるテキストファイルは改行なし、になる。
日本語の文字の間に半角スペースが入ることがあるようですな。
このOCRエンジンでは。 スキャンすると「キュルキュル」音が出るようになったんだけど、何が原因だろう?
紙質の問題? 裁断されて捨てられていった書籍たちの『呪怨』ですね。
気をつけてください。夜、給紙カバーを持ち上げて出てきますから。 薄いツルツルのカラーページをスキャンする時なんかはキュルキュルいうから紙質の問題では? スキャン語だな
奴ら酔うと自分達の来た星のこと話始めるから
適当に相づち打っとけ >>851
紙質の問題かと。
ほかの種類の紙をスキャンしても、同じ音がしますか?
各種ローラーを清掃しても、同じ紙をスキャンしたら
同じ音がしますか? >>855
>>857
故障じゃなくて紙質の問題だと良いのですが…
明日ローラー等を清掃してみます 858です
特定の紙で音が出るので紙質の問題だったようです
ありがとうございました 富士通は、パソコン工場を島根県にだけ持っている(島根富士通、大規模らしいけど)。
それに対して、PFUは、スキャナの工場を、中国とインドネシアと日本に持っているという。(小規模かもしれないけど)
http://www.fujitsu.com/jp/microsite/scanner/quality/control/02.html
これは、やはりPFUが、他社OEMでもスキャナを作っていて「圧倒的優位」に立っているということなのですか?
(将来はレノボブランドでもスキャナー作ったりして???) s1500で消えない縦線が出てきたんでそろそろ買い替えようかと久々に公式へ行ったが
7年経ってもあまり進歩してないね
Acrobatが付かなくなって変なソフトが添付されるようになったし・・・
縦線をAIで消すドライバソフトウェアを早く開発して欲しいわ 線状に抜けた所を推定して誤魔化すのってテレビのIP変換みたいに出来ないのかな macOSの最新版対応してないんだね。
いつになったら対応するんだろう。 >>863
>>864
クリスマス・年末年始まで待てるなら
あと二段階くらい安くなるよ
ご期待あれ >>869
>868のオーバースキャンと黒背景はある
>865の縦線除去機能も付いてるて前にどっかのスレで聞いたが未確認 >>867
High Sierraで問題なく動いてるように思うが、対応してないんか >>872
> >865の縦線除去機能も付いてるて前にどっかのスレで聞いたが未確認
まじで?
公式見たが確認出来なかった ツルツルの雑誌の取り込みでジャムが頻発する
濡れた雑巾でページの真ん中をさっとなぞってやったらジャムが発生しなくてワロタ 紙送りの黒い大型ローラーが滑っていますね。
そのローラーだけを水で湿らせてやってもいくらかもちます。
なぞるにはウェットティシュもいいですよ。 >>879
ローラーの「定期的な清掃」では解決しない問題なのですね。
>>877は。
ページの中央部を湿らせる:と。
ローラーを湿らせても、それが乾いてくると
(紙とローラ類との摩擦が弱くなってくると)
また滑って給紙できなくなります。
いろいろな紙についてスキャナーで作業すると理解できる現象です。
[別話題]
↓このような紙も曲者です。上縁が上にちょっと反っている。
給紙エラーが出ます。
ある特定の出版社の書籍にのみエラーが生じました。
よく見ると、このような断面になっていました。
(拡大図です)
その出版社が利用したある印刷会社が使った紙の裁断の問題ですね。
(それがべつに悪いわけではない・・)
解決するには、すべてのページの上部を
「へ」の位置で裁断することでした。
https://i.imgur.com/BkB3tH4.jpg >>881
消耗品ですからね
売ってますよローラー
ウチには一個確保してあります ローラーを交換しても、滑って給紙エラーが起こる紙質はある。
いろいろな紙に「頭を使って」対応することが重要です。
交換するだけが「万能の解決策」ではない。
もちろん適切に消耗部分を交換することは必要
経験が物を言います ■ このスレッドは過去ログ倉庫に格納されています