>>923
日本語だけとか英語だけとかだったら、そんなに難しい話じゃない
(とはいっても、英語の場合、「シラブルの区切りがどこにあるか」
っていうデータを持ってないとダメなんだが)。
論文みたいに、「日本語の文章の中に外来語の単語がいっぱい入ってる」
みたいな文章だと、禁則文字とかハイフネーションとかがごっちゃになって、
ものすげぇ面倒臭い話になるんだ。
で、文(段落)が終わってない途中の行だと、「左右均等割り」っていうのを
しなきゃならないだろ? それをドット単位で調節するのが、けっこう面倒臭い
んだよ。
このあたりの質問だったら、ム板の『自然言語処理スレッド その4』
(ttps://mevius.5ch.net/test/read.cgi/tech/1401741600/)で
のたくってるから、そっちで適当に質問してくれ。