debi12345 писал(а):Хоть один пример (опасного) промаха
По первой ссылке, что я привёл. Опасность не для целостности памяти, а для валидности данных, когда программист считает, что UCS-2 достаточно. Пусть хоть 99.999% всего текста в мире выражаются в UCS-2, это не повод выбрасывать остальные 0.001%. А то, по вашей же логике, если гонка проявляется в 1 случае из
(да скольки угодно), её можно не исправлять.
debi12345 писал(а):несуществующих
Сколько можно. -_-" Там не только древняя письменность, но и специфические символы (математические или там игровые).
Кандзи не выдумываются, а заимствуются из китайского. "Very rarely-used" ни разу не значит "not used". "This isn't an issue for most applications, however" — видите ли,
для локального использования у японцев свои костыли, тот же Shift-JIS — но
это не юникод (хотя идеей напоминает UTF-8), недостатки и несовместимость в обе стороны с другой локалью у них ровно те же, что у ANSI. Разговор как раз о том, как от этого уйти.
А
alexey38, похоже, вздумал пугать меня сложностью задач (месяцами вникать, в NASA работаете?) и даже привёл-таки цифры, только среди них опять нет тех, что я просил.
alexey38 писал(а):Наличие концепции - это лирика.
Что? Подучи-ка терминологию. Я понимаю, что в контексте паскалей кажется невозможным само существование библиотек вроде Boost, но они есть и работают. И без говнокода, удивительно, правда?
alexey38 писал(а):Если бы индексация строки была не по целому числу, а при помощи класса, в котором хранилось бы не только номер символа, но и его смещение, то без вопросов, но в реальности такой реализации нет.
Хоспаде, даже без C++-стайл итераторов кто тебе мешает использовать то же число, но в качестве индекса байта, а не символа?
Для русского языка в его нынешнем виде, можно смело пользоваться UCS16, но в мультиязычной постановке только UTF32. А там, где гарантированно только английский текст, то там можно пользоваться обычными 8-битными строками.
Предлагаешь вернуться к аду с 9000 кодировок? Зато в каждой отдельно взятой по байту на символ, чо. Я не буду расписывать, почему одна универсальная (или 2, со взаимно комплементирующими свойствами) лучше — т. к. ты этого в упор не понимаешь.