Как отладить Ваш PHP сайт для использования UTF8. ЧАСТЬ 1 - Jaaj.Club
Для судейства Битв Авторов необходимо авторизоваться и достичь 15-го писательского уровня.

События

10.02.2025 17:30
📢 Хорошие новости! 📢

Jaaj.Club подписал партнёрское соглашение с ведущими мировыми книжными магазинами! Теперь наши издания доступны на электронных прилавках наших партнёров.

Ищите книги Коллекция Jaaj.Club в магазинах:

Amazon.png
Indigo.png

Litres.png

publishing-logo-ibooks.png

publishing-logo-bt.png

publishing-logo-kobo.png

ridero.png

publishing-logo-smashwords.png


Следите за обновлениями! Список партнёров постоянно пополняется! 🔥📖

Комментарии

Здравствуйте! Обложки для книг создаются вручную, а не автоматически. Мы обязательно займемся этим в ближайшее время. Благодарим за понимание!
27.03.2025 Jaaj.Club
Здравствуйте! Отправила сюда 3 главы своей новой истории, но почему-то на обложке нет изображения, а внутри глав. Еще у меня вышла законченная история "Королевство за небесной дырой" и у нее тоже нет изображения на обложке. Что случилось?
27.03.2025 Elizaveta3112
Большая машина
25.03.2025 Jaaj.Club
Как их незамечать?Я боюсь!!,
15.02.2025 Гость
Классика! Советую к прочтению из этой же серии - "Книга дневных записей"
08.02.2025 Jaaj.Club

Опрос

Что интересней прочитать в новых выпусках Jaaj.Club?


10.02.2015 Рубрика: Компьютеры

Как отладить Ваш PHP сайт для использования UTF8. ЧАСТЬ 1

Автор: qwertynet
Два основных шага по устранению возникающих ошибок при работе с utf-8
2347 0 0 2 596

Как отладить Ваш PHP сайт, чтобы использовать UTF8


По версии Google UTF8 является самой популярной кодировкой в Интернете! Я удивляюсь тому, как много существует великолепных кодировок, но мировой интернет предпочел именно эту. Еще старый добрый Dreamweaver, насколько я помню, создавал новые веб-страницы по умолчанию на utf8, и так много начинающих веб-дизайнеров, вероятно, создавали свои первые сайты на Unicode, даже не осознавая этого. Но почему при таком обильном напоре “ЗА” существуют противники этого?

Я думаю, что есть несколько причин, почему многие веб-дизайнеры и разработчики не используют Unicode в своих разработках.

Самое частое, что приходится слышать на зарубежных форумах:

"Я не нуждаюсь в Unicode, потому что мой сайт на английском языке!"


Бьюсь об заклад, это самое распространенное и глупое оправдание. Даже если предположить, что все содержимое вашего сайта на английском языке, многие из ваших посетителей могут быть иностранцами, которым будет неудобен английский в качестве основного языка. Например, если у вас есть разделы, где пользователи могут делиться своими мыслями и предложениями (форумы, формы обратной связи, комментарии к блогам и т.д.). Даже если вы скажете, что все ваши посетители являются носителями английского языка, я могу ручаться, что у некотоых из них будут символы в имени, коорые не смогут быть представлены в Windows Latin или ASCII кодировках.

"Unicode – это трудно!"


На самом деле, так и есть. Потому что для создания полностью совместимого с UNICOD веб-сайта, необходимо проделать немало шагов. Давайте пройдемся по ключевых пунктам для типичного PHP + MySQL сайта:

Краткое замечание про UTF-8 и Unicode


Действительно существует несколько форматов данных Unicode, но UTF-8 является наиболее используемой в Интернете. В этой статье я буду представлять UTF-8 и Unicode, как одно и то же. 

ШАГ 1: Измените настройки своего текстового редактора / IDE, на работу в кодировке UTF8


Что нужно сделать первым шагом, это установить ваш редактор так, чтобы:

  • Новые файлы создавались в UTF-8 формате, без BOM (подробнее об этом дальше)
  • Существующие файлы преобразовывались в UTF-8.

Что такое BOM?

BOM (анг. Byte Order Mark) – метка порядка байтов, используется для определения формата представления Юникода (анг. Unicode). Иногда BOM применяется для обозначения формата UTF-8. BOM выглядит как символ U+FEFF в начале текста, что соответствует неразрывному пробелу с нулевой шириной.

При попадании BOM в коде php, появляются ошибки, которые срау видны на экране. В то время как код html может этого и не заметить, правда бывали замечены случаи сдвигов, уползания, нечитаемых абзацев абракадабры и многое другое.

ШАГ 2: Добавьте соответствующий <META> тег в вашем HTML заголовке


Для HTML

<meta http-equiv="content-type" content="text/html; charset=utf-8"></meta>

Для XHTML

<meta http-equiv="content-type" content="text/html; charset=utf-8" />

Есть и альтернатива для XHTML документов – установка кодировки для веб-страницы:

<? xml version="1.0" encoding="utf-8" ?>

Но у этого способа есть один существенный недостаток, IE 6 будет возвращаться к 1997 году и отображать страницу в режиме совместимости. Так что лучше придерживаться примера с мета тэгами.

Зачастую эти два шага охватывают до шестидесяти процентов ключевых ошибок, возникающих при работе с UTF-8 на PHP. Не бойтесь работать с UTF-8, это просто! 

Подпишитесь на бесплатную еженедельную рассылку

Каждую неделю Jaaj.Club публикует множество статей, рассказов и стихов. Прочитать их все — задача весьма затруднительная. Подписка на рассылку решит эту проблему: вам на почту будут приходить похожие материалы сайта по выбранной тематике за последнюю неделю.
Введите ваш Email
Хотите поднять публикацию в ТОП и разместить её на главной странице?

Как отладить Ваш PHP сайт для использования UTF8. ЧАСТЬ 3

В статье рассматривается самый частый случай - работа с XML контентом в PHP файле Читать далее »

Эти непонятные слова. Физический и программный токен

Слово токен появилось еще очень давно. Но, люди начали его активно употреблять в повсеместной речи около 10 лет назад. Сейчас постараемся разобраться в сложившейся ситуации. Читать далее »

Комментарии

-Комментариев нет-