alexey38 писал(а):Во-первых, он строго адаптирован к конкретному тесту, и сравнение с кодом проблема - это частный, а не общий случай, так что не везде применишь.
Кот бы говорил про упёртость, везде тестировалось сравнение с #32.
alexey38 писал(а):Но самое главное, Вы выполнили преобразование из UTF8, в UTF32.
Не подменяй понятия. UTF-8 — представление исходной строки в памяти. Идея не в том, чтобы нагло считерить, прочитав UTF-32, а в вычленении символа, чтобы с ним можно было работать. Всё равно что прочитать в регистр. Или предлагаешь наложить искусственные ограничения на реализацию?
debi12345, в C таким мазохизмом занимаются редко, в крестах же есть boost::locale::conv::utf_to_utf и
http://utfcpp.sourceforge.net/.
SeZuka, я ж не с потолка 1.5 взял, можете проверить сами на любой книжке. Русский текст — 1.5x, английский — 1.25x, японский — ок, таки 4x (UPD: чуть меньше, ~3.5), но для меня загадка, почему тормозит рандомный текст.