Модератор: Модераторы
runewalsh писал(а):Не подменяй понятия. UTF-8 — представление исходной строки в памяти. Идея не в том, чтобы нагло считерить, прочитав UTF-32, а в вычленении символа, чтобы с ним можно было работать. Всё равно что прочитать в регистр. Или предлагаешь наложить искусственные ограничения на реализацию?
runewalsh писал(а):Кот бы говорил про упёртость, везде тестировалось сравнение с #32.
debi12345 писал(а):но для меня загадка, почему тормозит рандомный текст.
alexey38 писал(а):Потому, что в нем символов UTF8 длиннее 1 байта более 50%, и около 10% более 2 байт (т.е. 3 байтовые символы).
alexey38 писал(а):прибавить его к другой строке
произвольный доступ к строке не нужен (любая обработка предусматривает поиск обрабатываемого куска)
debi12345 писал(а):А если строка размеченена на фоагменты и нужнео моментально перейти на нужный
runewalsh писал(а):индексированный доступ, в случае с юникодом применимый только к UTF-32
и номер символа, и смещение данных.
runewalsh писал(а):И индексы ты используешь только потому, что разработчики языка не посчитали нужным вводить итераторы
runewalsh писал(а):произвольный доступ к строке не нужен
debi12345 писал(а):А если какой-то из предшествующихз символов заменен на символ например другой длины?
debi12345 писал(а):Смешно, когда малоопытная молодежь гнет пальцы веером, говоря о своем великом опыте.
alexey38 писал(а):но быстродействие от этого бы не повысилось.
runewalsh писал(а):а скорость последовательного слишком сравнима, чтобы вносить оверхед по памяти, зависимость от endianness и вообще заменять тип строк
alexey38 писал(а):скорость одного вызова функции UTF8Length(utf8)
runewalsh писал(а):Слушай, ты, может, и linked list не используешь, потому что пытаешься индексировать и ноешь, что тормозит?
runewalsh писал(а):Опять же, различай длину и аналог концевого итератора.
runewalsh писал(а):Опытный дядька слишком опытен, чтобы привести пример истинно произвольного доступа, ага.
runewalsh писал(а):Серьёзно, никто не мешает во время разметки запомнить и номер символа, и смещение данных.
runewalsh писал(а):Фиксим индекс. Понадобится структура данных с логарифмической сложностью изменения, но для подобной обработки она понадобится вам всё равно.
alexey38 писал(а):дополнительно к каждому символу создать массив 32 битных индексов, где хранить смещение символов?
alexey38 писал(а):извращенец
маразм
Notepad++ практически одинаково тормозит на загрузке и редактировании больших файлов с любой кодировкой.
debi12345 писал(а):ТЕКСТОВЫЙ редактор, при загрузке тупо конвертящий
Сейчас этот форум просматривают: Google [Bot] и гости: 250