Персональный сайт
Романа Парпалака
  Заметки Блог Движок сайтов Игра «Жизнь»  
Главная → Блог → 2010 → 04 → 10

UTF-8 bad chars

10 апреля 2010 года, 01:36

Вопрос о «плохих» данных в UTF-8. Иногда такое знание оказывается полезным. Например, в корректной UTF-8 строке не могут встретиться байты 0xC0, 0xC1. Это может пригодиться при обработке строк для экранировки неизменяемых последовательностей символов (таких, как html-теги). Экранируемые подстроки вырезаются из строки, на их место ставятся символы с кодом 0xC0, строка обрабатывается, после чего подстроки возвращаются назад, вместо 0xC0.

Ключевые слова: PHP

Оставьте свой комментарий

Ваше имя:

Комментарий:

Для выделения используйте следующий код: [i]курсив[/i], [b]жирный[/b].
Цитату оформляйте так: [q = имя автора]цитата[/q] или [q]еще цитата[/q].
Ссылку начните с http://. Других команд или HTML-тегов здесь нет.

Сколько будет 22+4?

ПнВтСрЧтПтСбВс
1234
567891011
12131415161718
19202122232425
2627282930
Записи
Посетителям
наверх