0925仕様書無しさん
2018/07/24(火) 13:35:23.65日本語だけとか英語だけとかだったら、そんなに難しい話じゃない
(とはいっても、英語の場合、「シラブルの区切りがどこにあるか」
っていうデータを持ってないとダメなんだが)。
論文みたいに、「日本語の文章の中に外来語の単語がいっぱい入ってる」
みたいな文章だと、禁則文字とかハイフネーションとかがごっちゃになって、
ものすげぇ面倒臭い話になるんだ。
で、文(段落)が終わってない途中の行だと、「左右均等割り」っていうのを
しなきゃならないだろ? それをドット単位で調節するのが、けっこう面倒臭い
んだよ。
このあたりの質問だったら、ム板の『自然言語処理スレッド その4』
(ttps://mevius.5ch.net/test/read.cgi/tech/1401741600/)で
のたくってるから、そっちで適当に質問してくれ。