Строка - это набор символов, где символ - это то же самое, что
и байт. Это значит, что PHP поддерживает ровно 256 различных
символов, а также то, что в PHP нет встроенной поддержки
Unicode. Смотрите также
подробности реализации строкового типа.
Замечание:
Нет никаких проблем, если строка очень велика. Практически
не существует ограничений на размер строк, налагаемых PHP; единственный лимит
- это доступная память на компьютере, на котором запущен PHP.
Синтаксис
Строка может быть определена четырьмя различными способами:
Простейший способ определить строку - это заключить ее в
одинарные кавычки (символ ').
Чтобы использовать одинарную кавычку внутри строки,
проэкранируйте ее обратной косой чертой (\).
Если необходимо написать саму обратную косую черту, продублируйте ее
(\\).
Все остальные случаи применения обратной косой черты будут интерпретированы как
обычные символы: это означает, что если вы попытаетесь использовать другие управляющие
последовательности, такие как \r или \n,
они будут выведены как есть вместо какого-либо особого поведения.
Замечание:
В отличие от синтаксиса двойных кавычек
и heredoc,
переменные и
управляющие последовательности для специальных
символов, заключенных в одинарные кавычки, не
обрабатываются.
echo 'это простая строка';
echo 'Также вы можете вставлять в строки символ новой строки вот так, это нормально';
// Выводит: Однажды Арнольд сказал: "I'll be back" echo 'Однажды Арнольд сказал: "I\'ll be back"';
// Выводит: Вы удалили C:\*.*? echo 'Вы удалили C:\\*.*?';
// Выводит: Вы удалили C:\*.*? echo 'Вы удалили C:\*.*?';
// Выводит: Это не будет развернуто: \n новая строка echo 'Это не будет развернуто: \n новая строка';
// Выводит: Переменные $expand также $either не разворачиваются echo 'Переменные $expand также $either не разворачиваются'; ?>
Двойные кавычки
Если строка заключена в двойные кавычки ("), PHP распознает
большее количество управляющих последовательностей для
специальных символов:
Управляющие последовательности
Последовательность
Значение
\n
новая строка (LF или 0x0A (10) в ASCII)
\r
возврат каретки (CR или 0x0D (13) в ASCII)
\t
горизонтальная табуляция (HT или 0x09 (9) в ASCII)
\v
вертикальная табуляция (VT или 0x0B (11) в ASCII) (с версии PHP 5.2.5)
\e
escape-знак (ESC или 0x1B (27) в ASCII) (с версии PHP 5.4.0)
\f
подача страницы (FF или 0x0C (12) в ASCII) (с версии PHP 5.2.5)
\\
обратная косая черта
\$
знак доллара
\"
двойная кавычка
\[0-7]{1,3}
последовательность символов, соответствующая
регулярному выражению символа в восьмеричной
системе счисления
\x[0-9A-Fa-f]{1,2}
последовательность символов, соответствующая
регулярному выражению символа в шестнадцатеричной
системе счисления
Как и в строке, заключенной в одинарные кавычки, экранирование любого символа
выведет также и саму обратную косую черту. До версии PHP 5.1.1, обратная косая
черта в \{$var} не печаталась.
Но самым важным свойством строк в двойных кавычках является
обработка переменных.
Смотрите более подробно: обработка строк
Heredoc
Третий способ определения строк - это использование
heredoc-синтаксиса: <<<. После
этого оператора необходимо указать идентификатор,
затем перевод строки. После этого идет сама строка,
а потом этот же идентификатор, закрывающий вставку.
Строка должна начинаться с закрывающего идентификатора,
т.е. он должен стоять в первом столбце строки. Кроме того, идентификатор должен
соответствовать тем же правилам именования, что и все остальные
метки в PHP: содержать только буквенно-цифровые символы и знак
подчеркивания, и не должен начинаться с цифры (знак подчеркивания разрешается).
Внимание
Очень важно отметить, что строка с закрывающим идентификатором
не содержит других символов, за исключением,
возможно, точки с запятой
(;). Это означает, что идентификатор
не должен вводиться с отступом и что не
может быть никаких пробелов или знаков табуляции до или после
точки с запятой. Важно также понимать, что первым символом перед
закрывающим идентификатором должен быть символ новой строки,
определенный в вашей операционной системе. Например, на Macintosh
это \r. После закрывающего идентификатора (необязательно
дополненного точкой с запятой) также сразу должна начинаться новая строка.
Если это правило нарушено и закрывающий идентификатор не является
"чистым", считается, что закрывающий идентификатор отсутствует и
PHP продолжит его поиск дальше. Если в этом случае верный
закрывающий идентификатор так и не будет найден, то это вызовет
ошибку парсинга с номером строки в конце скрипта.
Heredoc не может быть использован для инициализации полей класса.
Начиная с версии PHP 5.3, это ограничение распространяется только на heredoc,
содержащие внутри себя переменные.
Пример #1 Неверный пример
class foo { public $bar = <<bar EOT; } ?>
Heredoc-текст ведет себя так же, как и строка в двойных кавычках,
при этом их не имея. Это означает, что вам нет необходимости
экранировать кавычки в heredoc, но вы по-прежнему можете
использовать вышеперечисленные управляющие последовательности.
Переменные обрабатываются, но с применением сложных переменных
внутри heredoc нужно быть также внимательным, как и при работе
со строками.
Пример #2 Пример определения heredoc-строки
$str = <<Пример строки, охватывающей несколько строчек, с использованием heredoc-синтаксиса. EOD;
/* Более сложный пример с переменными. */ class foo { var $foo; var $bar;
echo <<Меня зовут "$name". Я печатаю $foo->foo. Теперь я вывожу {$foo->bar[1]}. Это должно вывести заглавную букву 'A': \x41 EOT; ?>
Результат выполнения данного примера:
Меня зовут "МоеИмя". Я печатаю Foo.
Теперь, я вывожу Bar2.
Это должно вывести заглавную букву 'A': A
Также возможно использовать heredoc-синтаксис для передачи данных
через аргументы функции:
Пример #3 Пример применения heredoc в аргументах
var_dump(array(<<foobar! EOD )); ?>
Начиная с версии 5.3.0, стала возможной инциализация статических переменных
и свойств/констант класса с помощью синтаксиса heredoc:
Пример #4 Использование heredoc для инциализации статических переменных
// Статические переменные function foo() { static $bar = <<Здесь ничего нет... LABEL; }
// Class properties/constants class foo { const BAR = <<Пример использования константы FOOBAR;
public $baz = <<Пример использования поля FOOBAR; } ?>
Начиная с версии PHP 5.3.0 можно также окружать идентификатор Heredoc
двойными кавычками:
Пример #5 Использование двойных кавычек в heredoc
echo <<<"FOOBAR" Привет, мир! FOOBAR; ?>
Nowdoc
Nowdoc - это то же самое для строк в одинарных кавычках, что и
heredoc для строк в двойных кавычках.
Nowdoc похож на heredoc, но внутри него не осуществляется
никаких подстановок. Эта конструкция идеальна для внедрения
PHP-кода или других больших блоков текста без необходимости
его экранирования. В этом он немного похож на SGML-конструкцию
<![CDATA[ ]]> тем, что объявляет блок текста,
не предназначенный для обработки.
Nowdoc указывается той же последовательностью <<<,
что используется в heredoc, но последующий за ней идентификатор заключается
в одинарные кавычки, например, <<<'EOT'.
Все условия, действующие для heredoc идентификаторов также действительны
и для nowdoc, особенно те, что относятся к закрывающему идентификатору.
Пример #6 Пример использования nowdoc
$str = <<<'EOD' Пример текста, занимающего несколько строк, с помощью синтаксиса nowdoc. EOD;
/* Более сложный пример с переменными. */ class foo { public $foo; public $bar;
echo <<<'EOT' Меня зовут "$name". Я печатаю $foo->foo. Теперь я печатаю {$foo->bar[1]}. Это не должно вывести заглавную 'A': \x41 EOT; ?>
Результат выполнения данного примера:
Меня зовут "$name". Я печатаю $foo->foo.
Теперь я печатаю {$foo->bar[1]}.
Это не должно вывести заглавную 'A': \x41
Замечание:
В отличие от heredoc, nowdoc может быть использован в любом контексте
со статическими данными. Типичный пример инициализации полей класса
или констант:
Пример #7 Пример использования статичных данных
class foo { public $bar = <<<'EOT' bar EOT; } ?>
Замечание:
Поддержка nowdoc была добавлена в PHP 5.3.0.
Обработка переменных
Если строка указывается в двойных кавычках, либо при помощи
heredoc, переменные внутри
нее обрабатываются.
Существует два типа синтаксиса:
простой и
сложный.
Простой синтаксис более легок и удобен. Он дает возможность
обработки переменной, значения массива (array) или
свойства объекта (object) с минимумом усилий.
Сложный синтаксис может быть определен
по фигурным скобкам, окружающим выражение.
Простой синтаксис
Если интерпретатор встречает знак доллара ($), он
захватывает так много символов, сколько возможно, чтобы сформировать
правильное имя переменной. Если вы хотите точно определить конец имени,
заключайте имя переменной в фигурные скобки.
$juice = "apple";
echo "He drank some $juice juice.".PHP_EOL; // не работает, 's' - это верный символ для имени переменной, // но наша переменная имеет имя $juice. echo "He drank some juice made of $juices."; ?>
Результат выполнения данного примера:
He drank some apple juice.
He drank some juice made of .
Аналогично могут быть обработаны элемент массива
(array) или свойство объекта (object).
В индексах массива закрывающая квадратная скобка
(]) обозначает конец определения индекса.
Для свойств объекта применяются те же правила, что и для простых
переменных.
echo "He drank some $juices[0] juice.".PHP_EOL; echo "He drank some $juices[1] juice.".PHP_EOL; echo "He drank some juice made of $juice[0]s.".PHP_EOL; // Не будет работать echo "He drank some $juices[koolaid1] juice.".PHP_EOL;
class people { public $john = "John Smith"; public $jane = "Jane Smith"; public $robert = "Robert Paulsen";
public $smith = "Smith"; }
$people = new people();
echo "$people->john drank some $juices[0] juice.".PHP_EOL; echo "$people->john then said hello to $people->jane.".PHP_EOL; echo "$people->john's wife greeted $people->robert.".PHP_EOL; echo "$people->robert greeted the two $people->smiths."; // Не будет работать ?>
Результат выполнения данного примера:
He drank some apple juice.
He drank some orange juice.
He drank some juice made of s.
He drank some purple juice.
John Smith drank some apple juice.
John Smith then said hello to Jane Smith.
John Smith's wife greeted Robert Paulsen.
Robert Paulsen greeted the two .
Для чего-либо более сложного, используйте сложный синтаксис.
Сложный (фигурный) синтаксис
Он называется сложным не потому, что труден в понимании,
а потому что позволяет использовать сложные выражения.
Любая скалярная переменная, элемент массива или свойство объекта,
отображаемое в строку, может быть представлена в строке этим синтаксисом.
Просто запишите выражение так же, как и вне строки, а
затем заключите его в { и }.
Поскольку { не может быть
экранирован, этот синтаксис будет распознаваться только когда $
следует непосредственно за {. Используйте
{\$, чтобы напечатать {$.
Несколько поясняющих примеров:
// Показываем все ошибки error_reporting(E_ALL);
$great = 'здорово';
// Не работает, выводит: Это { здорово} echo "Это { $great}";
// Работает echo "Этот квадрат шириной {$square->width}00 сантиметров.";
// Работает, ключи, заключенные в кавычки, работают только с синтаксисом фигурных скобок echo "Это работает: {$arr['key']}";
// Работает echo "Это работает: {$arr[4][3]}";
// Это неверно по той же причине, что и $foo[bar] вне // строки. Другими словами, это по-прежнему будет работать, // но поскольку PHP сначала ищет константу foo, это вызовет // ошибку уровня E_NOTICE (неопределенная константа). echo "Это неправильно: {$arr[foo][3]}";
// Работает. При использовании многомерных массивов внутри // строк всегда используйте фигурные скобки echo "Это работает: {$arr['foo'][3]}";
Функции, вызовы методов, статические переменные классов, а также
константы классов работает внутри {$}, начиная
с версии PHP 5.
Однако, указываемое значение будет обработано как имя переменной
в том же контексте, что и строка, в которой она определяется.
Использование одинарных фигурных скобок ({})
не будет работать для доступа к значениям функций, методов,
констант классов или статических переменных класса.
// Показываем все ошибки error_reporting(E_ALL);
class beers { const softdrink = 'rootbeer'; public static $ale = 'ipa'; }
$rootbeer = 'A & W'; $ipa = 'Alexander Keith\'s';
// Это работает, выводит: Я бы хотел A & W echo "Я бы хотел {${beers::softdrink}}\n";
// Это тоже работает, выводит: Я бы хотел Alexander Keith's echo "Я бы хотел {${beers::$ale}}\n"; ?>
Доступ к символу в строке и его изменение
Символы в строках можно использовать и модифицировать,
определив их смещение относительно начала строки, начиная с
нуля, в квадратных скобках после строки, например, $str[42].
Думайте о строке для этой цели, как о массиве символов.
Если нужно получить или заменить более 1 символа, можно использовать
функции substr() и substr_replace().
Замечание:
К символу в строке также можно обращаться с помощью фигурных скобок,
например, $str{42}.
Внимание
Попытка записи в смещение за границами строки дополнит строку
пробелами до этого смещения. Нецелые типы будет преобразованы в целые.
Неверный тип смещения вызовет ошибку уровня E_NOTICE.
Запись по отрицательному смещению вызовет ошибку уровня E_NOTICE,
а при чтении вернет пустую строку.
Используется только первый символ присваемой строки.
Присвоение пустой строки присваивает нулевой байт (NULL).
Пример #9 Несколько примеров строк
// Получение первого символа строки $str = 'This is a test.'; $first = $str[0];
// Получение третьего символа строки $third = $str[2];
// Получение последнего символа строки $str = 'This is still a test.'; $last = $str[strlen($str)-1];
// Изменение последнего символа строки $str = 'Look at the sea'; $str[strlen($str)-1] = 'e';
?>
Замечание:
Попытка доступа к переменным других типов (исключая массивы или
объекты, реализующие определенные интерфейсы) с помощью []
или {} молча вернет NULL.