ScanSnapシリーズ総合スレ Part41
レス数が900を超えています。1000を超えると表示できなくなるよ。
客先でSEやってる頃はこんな質問されて律儀に調べて好感度うpしようとしてた Homeのアップデート1.0.30→1.1.0の通知来ましたね。どう改善されたんだろう。
でも時すでに遅し。領収書1400枚、Pythonで書いた合計金額抽出プログラムがあやしかったんで
Excel上で画像へのハイパーリンク作って、全部目視しながらCSV上の金額を訂正してったわw
それでもHome上で修正するよりは格段に速い。4時間ぐらいかかったけど。
最頻出の金額を抽出するとなぜかサイゼリアの食事の金額がよく間違ってました。
同一価格のメニューばっかり頼んでるからですねw。
あとはなぜかNewDaysのコンビニのレシートだけ日付認識してないの。変なの。
今回Fineでスキャンしてたので、解像度あげてGoogleCloudVisionに投げたらいいかもしれない。
あと合計金額は「合計」って文字の座標をとってきてそれと同じY座標の金額を
取ってくるようにすればいけそう。
あとはポイント利用分が合計額に反映されていると都合がわるいので、ポイント利用前の
金額を得たい。それぐらいかな、課題は。 スマホでレシートの写真撮ったら集計してくれるアプリあったよね Zaimのスマホカメラで読み取る方がよっぽど精度がいい気がする。
Zaimのプレミアム会員はWi-Fi接続できるscansnapでのレシート読み取りに対応してるけど、
PC経由のscansnapでも読み取れるようになれば、喜んでプレミアム会員になるのに。 >>848
これで良いと思いますが。
紹介されているサイトの「警告」のところで、
火災の原因になるから、有機溶剤、液体を使用するな;
そのあとの警告で、
(使用直後は)非常に高温になっているのでやけどに注意、とあり。
高温になっているところに上記有機溶剤を使用すると不慮の事故の可能性があるので危険ということでしょう。
ix500も連続使用の直後はボディが熱くなっていますが、事務用コピー機ほどではない。
スキャン部のガラスにこびりついた製本のりを取り除くためにアルコールを使うことがあるていどで、他の部分(ローラーなど)は水のみで拭いています
あまり、いろいろな有機溶剤を使うのはスキャナーを破損させる可能性があり危険だと思います。
使うならアルコールが無難かと。 ローラーが加水分解したっぽくてべたべたになり
紙送りが全くできない(巻き込む)ようになったs-1500って
需要あるのかな?
他の部分はまだ全然問題なさそうだから粗大ごみで捨てるのみ
なんとなく憚られる。 ニベアクリーム塗るとベタベタが直ると聞いたことがある >>851
そういう状態じゃない感じでべたべたでボロボロ
>>852
ピックローラーユニットじゃなくてフィードローラーの方かな。
結局調べてしまった。通販で1000円しないぐらいだから
交換すれば一応は売れるか・・・でも果てしなくめんどくさそうだ・・・
それともパーツと本体セットで売って後は交換してくださいで行けるかな? 意外にScanSnapもfiシリーズも分解しやすいのかね
s510とfi-6130zをぶっつけ本番で分解したけど元に戻せたし 確定申告終わったので、コード晒します。
まず1つ目。ほぼこちらのブログを参考にしています。
ttps://yoshitaku-jp.hatenablog.com/entry/2018/03/25/352/
import base64
import json
import requests
import glob
import os
os.chdir(u"C:\\Users\\XXXXXXXX\\AppData\\Roaming\\PFU\\ScanSnap Home\\ScanSnap Home\\家計簿")
filelist = glob.glob('*.jpg')
for file in filelist:
bin_captcha = open(file, 'rb').read()
str_encode_file = base64.b64encode(bin_captcha).decode('ascii')
str_url = "https://vision.googleapis.com/v1/images:annotate?key="
str_api_key = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
str_headers = {'Content-Type': 'application/json'}
str_json_data = {
'requests': [
{
'image': {
'content': str_encode_file
},
'features': [
{
'type': "TEXT_DETECTION",
'maxResults': 10
}
]
}
]
}
response = requests.post(str_url + str_api_key,
data=json.dumps(str_json_data),
headers=str_headers
)
json_response = json.loads(response.text)
description = json_response["responses"][0]["textAnnotations"][0]["description"]
words = description.split('\n')
words.insert(0,file)
mojiretsu = '","'.join(words)
print(mojiretsu)
with open(u"result.txt","a",encoding="utf-8_sig") as r:
r.write(mojiretsu+"\n") 2つ目。
def main():
import re
import collections
alllinecount = 0
nohidukecount = 0
nopricecount = 0
with open("result.txt", "r", encoding="utf-8_sig") as f:
lines = f.readlines()
for line in lines:
line.strip()
# print(line)
alllinecount += 1
hiduke = ""
# Exclude lines if the keyword exists
if "XXXXXXXX" in line or ("クレジット" in line):
hiduke = "1990/12/31" # To exclude line with year 1990
# Detect date ####
# Start with '2018' (The jpg filename includes date with ScansnapHome)
elif re.match("^201[789]", line):
hiduke = line[0:4] + "/" + line[4:6] + "/" + line[6:8]
# print(hiduke + line)
else:
# Search date in the middle of line due to lack of '2018' in front of the line
matchob = re.search("[01]?[0-9]月[0-3]?[0-9]", line)
if matchob:
md = matchob.group().split("月")
hiduke = "2018" + "/" + md[0] + "/" + md[1]
else:
nohidukecount += 1
hiduke = "2000/12/31" # If no detection of date, set year 2000
# Detect price/shopname ####
words = line.split('","')
for word in words:
word = word.replace(',', '').replace(' ', '').replace('.','') # Delete comma / space / period
#---- 2つ目つづき。
prices = []
shopnames = []
shopnames.append(words[1].strip()) # add first OCR word
shopnames.append(words[2].strip()) # add second OCR word
for word in words[1:]:
if re.match("[0-9]?[0-9]?[0-9]?[0-9][0-9]円$", word):
prices.append(sanit(word))
elif "\" in word:
prices.append(sanit(word))
elif "#" in word:
prices.append(sanit(word))
elif "株" in word:
shopnames.append(sanit(word))
elif "" in word:
shopnames.append(sanit(word))
elif re.search(".+店$", word):
shopnames.append(sanit(word))
elif ("家" in word):
shopnames.append(sanit(word))
elif ("屋" in word):
shopnames.append(sanit(word))
elif ("センター" in word):
shopnames.append(sanit(word))
elif ("パーク" in word):
shopnames.append(sanit(word))
elif ("駐" in word) and not (("料金" in word) or ("番号" in word)):
shopnames.append(sanit(word))
elif ("有料道路" in word):
shopnames.append(sanit(word))
shopnames = set(shopnames)
shopnames = '_'.join(shopnames).replace(" ", "").replace('"', '')
#---- 2つ目 最後。
# Add an item even if there is no detection of prices to avoid some error
if len(prices) == 0:
prices.append("9999999")
nopricecount += 1
# create a line with date, shopname, price, original data
p = collections.Counter(prices)
likelyprice = str(p.most_common()[0][0])
record = hiduke + ";" + shopnames + ";" + likelyprice \
+ ";" + words[0].rstrip('\n') + ";" + line.replace('","', "_")[0:160]
print(record)
# Show counter summary
print("all lines : " + str(alllinecount))
print("no hiduke lines: " + str(nohidukecount))
print("no price lines : " + str(nopricecount))
def sanit(word):
result = word.strip()
result = result.replace(',', '') # Delete comma
result = result.replace('、', '') # Delete kutouten
result = result.replace(' ', '') # Delete space
result = result.replace('金\', '') # Delete 「金」yenmark
result = result.replace('\', '') # Delete yenmark
result = result.replace('-', '') # Delete hyphen
result = result.replace('#', '') # Delete sharp
result = result.replace('円', '') # Delete kanji yen
return result
if __name__ == "__main__":
main() 先程のスクリプトの金額抽出ロジックは甘いので、今後は「合計」という文字列と同じ
Y座標にある数値をとってくる方向で改良しようと検討中。
あと、GoogleVisionを使わず、scansnap.dbのcontentsテーブルをSQliteブラウザとかでみてみると、電話番号はちゃんと認識しているので、
電話番号をウェブで検索して取ってくる企業名をVendorカラムをUpdateするSQL書いたほうが
現実的な気がしてきた。
最後に、レシートとして読み込ますよりも、文書で読み込ませたほうが、dbで保持する情報が
多いような。。。ここは調査が必要かも。 乙
まだ中身確認してないが次からは長いコードはアプロダかgithub gistなどでお願い
なんならquiitaに記事書いてくれてもいいのよ
ソースコード用のアプロダ
http://codepad.org/ >>863
ありがとうございます。
giihubやBitbucketなども考えましたが、中身素人過ぎてお恥ずかしいので、
適当なアプロダがわからずスレに貼り付けてしまいました。
本業インフラ屋なんで、プログラミングはほんとにド素人。
細かい点はご勘弁いただくとして、よろしければこちらをご参考になればと。
ttp://codepad.org/cTCEyzgm
ttp://codepad.org/utT8aewZ >>864
ありがとうございます。
APIへの投げ方とか具体的に書いてくださったので勉強になります。 ix1500を購入しました。これから自炊職人になろうと思います。
まずは裁断機を購入しようと思うのですが、このスレの皆様は何を使っておられますか?オススメがあればお聞かせください。 ツイッターやネットでテクノロジー犯罪と検索して、まじでやばいことを四代目澄田会の幹部がやってる
被害者に対して暴力団以外にタゲそらしをしてるがやってるのは暴力団で普段外に出ることが少ないため遊びで公共の電波と同じような電波を使って殺人をしてる
統失はほとんどが作られた病気で実際は電波によって音声送信や思考盗聴ができることが最近明らかになりつつある
警察や病院では病気としてマニュアル化されてしまっているのが現状で被害者は泣き寝入りしてる
被害者がリアルタイムで多い現状を知って、被害者間でしか本当の事だと認知できていない
実際にできると思われていない事だから、ただの幻聴ではない実際に頭の中で会話ができる
できないことだと思われているからこそ真面目に被害を訴えてる
海外でも周知されつつあることを知ってほしい。
このままだとどんどん被害が広がる一方
#テクノロジー犯罪
#四代目澄田会
[参考]
https://black.ap.teacup.com/yamisiougn01/6.html
https://tekunoroji-hanzaihigai.jimdo.com
https://blogs.yahoo.co.jp/patentcom 👀
Rock54: Caution(BBR-MD5:87f20c3c9ee883ab649a4d7f8b996d63) スレ違いとの意見もあろうかと思いますが、
ScansnapHomeが期待通り動いてくれたら、
レシートOCRに関する話題なんてしなかった
と思います。PFUのソフト開発陣もここを
みてくれていると予想しているので、些細なことでもみんなでHomeの不満をぶちまけていったら、
メーカーで改善の動きが促進されると期待しています。 >>871
DURODEXの200DX使ってるよ
使わないときはハンドルをたたんでしまえ、裁断枚数はPK-213より高い
PK-213は使ったことないが、どちらも切り口は斜めになるはず >>871
私もDURODEX 200DXを使っています。
たしか、群馬県(?)に適切な値段で調整してくれる業者があるはず。
そこで、何度か調整をしてもらいました。
裁断位置を示す赤い光の線が見づらいこともありますが、まあ問題ありません。
古くなると、裏側の電池ボックスの電池を押さえるバネが緩くなって、大きな振動を与えると電池がずれて位置線の光が消えることが起きるのが弱点だと思いますが、自分で簡単に調整可能です。
正面から見て裁断位置を確かめながら切ることができるのが使いやすい。
刃の方向とレバーの動作方向(=裁断作業する人の目線)が垂直なのです。 >>872>>875-877
親切なご教示ありがとうございます。よくわかりました、大変参考になりました。
DURODEX200DXを購入する方向で、あと半日ほど検討して、それから注文しようと思います。
どうもありがとうございました。 PK-513Lを所持していますが、切れ味、切り口ともに満足のいく品ではありますが
使わないときの置き場所、使う前の取り出し設置にはそれなりの労働で
加えてスキャンする手間も重なり利用頻度はとても少ないです
今Amazonでチェックしたらずいぶん価格が下がっていて
こういう商品でも安くなるもんだというか、まだ現行の選択肢の中にあるんだなとちょっと驚いてるわ >>878
二千冊くらい切ると切れなくなるけど
自分で砥げるから安心やで
なお失敗しても当局は一切感知はしない >>874
あんた人のこと考えている風で自分本位で自分勝手な人だと言われるでしょ
言われなくてもそう思われてるよ
メーカーに改善を要望したいなら見てくれているかもしれない掲示板に書くんじゃなくて
直接メーカーに電話するなりメールを送れば良いだけでしょ
それらしい理由つけて自分がやりたいことを正当化したいだけ
まず第一に保身なんだよね まぁ、板違いとアドバイスされてるのにかまわず続けちゃうくらいの図々しい奴だし相当嫌われてそうだね 今頃終わった話掘り返して怒り出すなんて、気持ち悪いわ。 一応サポートには電話して、軽く要望は伝えました。
レシートのデータ、とくに検索結果でのデータの一括修正が出来ない点が、いまいち納得できない仕様なので、そこだけでも改善してほしいです。
iX1500はレシートフィーダーがついていたり、カズチャンネルとフィーチャリングして、公式Webで確定申告な人も意識した動画もリンクされているし。
ちなみに自炊目的の人はHomeに対して不満はあんまりなさそうですね。 つかこれ貼られたのがスプリクトコードだったから拒絶反応出ちゃったんでしょ
APIキー取得の壁があるとはいえGCVでのOCRはexe化して簡単に試せるようになってたら
それなりに面白がられてたと思うぞ 裁断解体スレなら垂直に切れない話とか接着面の話とかしてるし
OCRスレなら張本が弓長本になったり金本が鉢になる話してる 最初からリアルタイムで読んでるよ
クレクレでgdgd引っ張るだけなら確かにうざいが
自力でコード組んでOCRと解析するところまでこぎつけたんだからたいしたもんじゃん
ここ別に自炊専用じゃないんだし
板違いの指摘は当初から的がはずれてたし
スキャン画像の活用法レポとしてはありだと思うが iX1500でスキャンすると縦線が入ります
表側用のセンサの一部に擦れた跡があり、
用紙を送った時に擦れてできた傷みたいに見えますが
どうしたらよいでしょうか?
厚めの用紙だとこのようになることがあるでしょうか? 傷に見える物はほとんどのケースでゴシゴシ拭けば取れる
拭いて取れなければ諦める 汚れかノリなら有機溶剤付けたウエスでこすって取れる
取れなければ傷なので修理に出すかあきらめる >>894
それは、製本糊がこびりついたものではないですか?
指で軽く触ってい見てください。
(ひっかき傷みたいに)引っ込んでいますか?それとも出っ張っていますか?
反対側のセンサー(ガラス)にもありますか?
LEDライトなどでよく光をあてて確認してみましょう。
汚れならば、きれいな水やアルコール(無水でも消毒用でも可)を柔らかい布に少量つけて、軽くこすります。
根気よくやればとれます。
アルコール以外の溶剤は使わないほうがいいでしょう。
メーカーがすすめる代替品としてもあげられていない。 みなさんありがとうございます
触ると僅かですが出っ張ってる感じあります
カメラ用のハクバ レンズクリーナーキットあるので
チャレンジしてみます スキャン読み取り面のガラスにつくのは糊がほとんど
ただし、熱があまり発生しないix1500にはほとんどつかないな ガラスは車用のガラコを塗れば良くなる
スマホにも使えて一石二鳥 読み取りセンサについた汚れらしきものは、
カメラ用のレンズクリーナーで綺麗に取れました
ありがとうございました。 一部の自炊野郎は、自分と違うスキャナの使い方をしてる香具師をまったく受け入れられない心の狭い持ち主みたいだな。哀れだな。 すぐスレ違いとか変な俺ルール持ち出す自治厨は触らずスルー推奨 いや、スレ違いなものはスレ違いで良いと思うが・・・
スレ違いと言われたことを根に持ってるんだね スレ違いじゃないものまでスレチイタチ言う奴がいるからなあ >>841
その後、解決しましたか?
きのうiX1500を買ったものの自分もWi-Fiで接続できないっすわ。
PCのScansnapHome側にスキャナー名も表示されてるのに接続しようとしたらエラー。
ファイアウォールにポート開けたりそもそもファイアウォール切ったりしてみても繋がらず。。。
iX1500側には接続良好とか出てるしPingも通るしなんなんだろ?
こんなとこでつまづくとは思わず敗北感に打ちひしがれてます。 俺はドライバ消して入れなおしたら直ったけど
買ったばっかじゃなあ・・・ >>908
サポートに問い合わせたらルーターを再起動させてみてとの事で、やったが駄目だった
wifiのダイレクト接続は出来るので、それで我慢している
スキャン中はネットが見られないが残念だけど仕方がないね 自分の機種は手順通りやったら問題なくつながった
何が違うんだろ
数万枚スキャンしてみたが
ガラス面にべっとりノリがついても無反応で、ブロワで飛ばせるホコリに反応するクリーニングセンサー
紙を分離するの力が弱く、紙の横にノリがついて厚くなると盛大に斜めにしてくれる搬送力
以外は満足している ix1500とscansnaphome使ってるんだけど、ファイル名の自動入力って詳細設定できないのかな
例えば、デフォルトでは、「文書内日付」_「タイトル」になってるけど、「タイトル」のみのファイル名に設定するとか >>911
ウチのは理由はしらんけど、掃除しようがしまいが毎回ほぼ汚れ警告が必ず表示されるので
もう完全無視してる >>912
その組み合わせに限らないけどScanSnap系アプリはどれもその辺の自由度が低いよね。ちょっと残念だわ。 >>912,915
ファイル名については別途ファイル管理ソフトを使用して一括変更したほうが楽 scansnapの泥アプリ
クラウド保存でgoogleドライブを設定しよう思ったんだけど
サイトに繋がらない >>916
PDFファイルの中のテキストデータを読み出してファイル名を自動で変更するソフトなんてある? SQliteファイルの中にcontentsという名のテーブルがある。ScanSnapがOCRしたデータが入ってるので好きな言語でファイル名変更のプログラム書けばいいよ、、、
っていうと、このスレ荒れるかな?(笑) あとね、jpgのファイル名変えちゃうとscansnap上でファイルが認識できなくなるかも。contentsレコードとファイルを対応させるテーブルがあったとおもう。
でも実際他PCにマイグレーションするときは、DBを持ってくんじゃなくて画像ファイルをもっていって、他PCでまたOCRが走るという糞仕様なんで、気にする必要ないかも。 >>908
>>910
その後サポートにiX1500のログを提出したところ、
「Wi-Fi接続設定はできてるもののタイムアウトしているようなのでUSBで接続してスキャン画面を呼び出した上でUSBを切断してね」と指示され、
そのとおりにしたところ無事に接続できるようになりました。
なぜそうなったのかは謎ですが。。。
そんな復帰方法もあると知ったので報告です。 >>922
自分は遭遇してないトラブルだけど参考にするわ。報告乙。 >>922
ポートがブロックされてるとかかな。
USB接続で使えるならWiFi使わないほうがトラブルは少ない。 SV600だけど、スキャンした見開きの書籍を調整するときに出る赤色の点線。
ソフトウェアが自動で描いてくれた時は曲線にも沿ってくれてるけど、ダブルクリックやドラッグで手動で誘導しても曲線にフィットしてくれないよね
曲線フィットさせる方法ってありませんか? 縦筋出てるからガラス見たら本当に筋になってるのね
除去してからスキャンして比較してみたけど、まだ縦筋が残ってる
ガラスにはもう汚れは見えないんだけど、見えないだけで残ってるってことかな?
https://imgur.com/NW0d94o
https://imgur.com/uNqgjOk >>926
上下両方のガラスに「よごれ」が無いかLEDライトで照らしてじっくり確認してはどうでしょうか?
両面スキャン設定で、同じ原稿を表・裏で2回スキャンして得た画像を比べてみるとどうなりますか?
画像に線を出すガラス(スキャン部)は片方だけ?
写真を見せていただくと、これは「糊の貼り付き」ではなく「線状の傷」のようにも見えますが・・・ ドキュメントスキャナ欲しいんだけど、イマイチ他社製品との違いが分からない。
例えば、DS-570W, DR-C225W IIなんだけど。
ScanSnap Cloudは優位な点だと思うけど、他には何かある?
ScanSnap Homeは評判あまり良くないよね。 独自ドライバなので使い勝手は他社とかなり異なる
・TWAINが使えない
・JPGかPDFでしか保存できない(JPEG強制)
・その他全般的に細かい調整ができない
まあ初めてのスキャナで他を知らなければ比較することもないだろうし
知識なくてもスキャナがよしなにやってくれるから楽っちゃ楽 EPSONの使い勝手(ソフトもふくめて)は気になるところ。 ix1500でPCにUSB接続すると、1秒ごとに接続と切断を繰り替えす謎の現象が起こる
wifi接続も本体はルーターに接続してるのに、PCがスキャナ本体を認識しなくて使えないんだよな >>929
デメリットの方が多くね?にもかかわらず人気があるのは何でだろ SV600の後継機出ればいいのだが
出ないのかな? SV600のメリットは縦線が出ないことだろうな
通常のフラベだと確かに画質は良いが時間かかりすぎで
トリミングや傾き補正をしないといけないだのデメリット大きすぎる >>935
S1500の時にいいタイミングでユーザー数増やしたというのが大きいと思う
詳しくは>684あたり
あと自分はフラベや複合機含めると結構複数メーカー使ってたので
その辺の独自性に耐えらんなくて結局fiへ移行した人間なので
メリットについては愛用し続けてる人が語ってくれると思うのでそっちを参考にして SV600って同じ修正内容が続く場合一ページ一ページマウスで修正しないとダメなの?
こんな感じ、ってのを指定の全ページに適応できないかなぁ
あと指もさ、同じような位置にあれば一括で消して欲しいところだけど..... 買ってみたものの、本を裁断するのは気が引ける、、、。みなさんは平気なのですか? >>940
初めから電子書籍版を買ったと思えばOK レス数が900を超えています。1000を超えると表示できなくなるよ。