1. Класс StringTokenizer
И еще несколько самых частых сценариев работы со строками. Как разбить строку на несколько частей? Для этого есть несколько способов.
Метод split()
Первый способ разбить строку на несколько частей — использовать метод split(). В него в качестве параметра нужно передать регулярное выражение: специальный шаблон строки-разделителя. Что такое регулярное выражение, вы узнаете в квесте Java Multithreading.
Пример:
| Код | Результат |
|---|---|
|
Результатом будет массив из трех строк: |
Просто, но иногда такой подход избыточен. Если разделителей много, например, «пробел», «enter», «таб», «точка», приходится конструировать достаточно сложное регулярное выражение. Его сложно читать, а значит, в него сложно вносить изменения.
Класс StringTokenizer
В Java есть специальный класс, вся работа которого — разделять строку на подстроки.
Этот класс не использует регулярные выражения: вместо этого в него просто передается строка, состоящая из символов-разделителей. Преимущества этого подхода в том, что он не разбивает сразу всю строку на кусочки, а потихоньку идет от начала к концу.
Класс состоит из конструктора и двух основных методов. В конструктор нужно передать строку, которую мы разбиваем на части, и строку — набор символов, используемых для разделения.
| Методы | Описание |
|---|---|
|
Возвращает следующую подстроку |
|
Проверяет, есть ли еще подстроки. |
Этот класс чем-то напоминает класс Scanner, у которого тоже были методы nextLine() и hasNextLine().
Создать объект StringTokenizer можно командой:
StringTokenizer имя = new StringTokenizer(строка, разделители);
Где строка — это строка, которую будем делить на части. А разделители — это строка, каждый символ которой считается символом-разделителем. Пример:
| Код | Вывод на экран |
|---|---|
|
|
Обратите внимание, что разделителем считается каждый символ строки, переданный второй строкой в конструктор StringTokenizer.
2. Метод String.format() и класс StringFormatter
И еще один интересный метод класса String — format().
Допустим, у вас есть различные переменные с данными. Как вывести их на экран одной строкой? Например, у нас есть данные (левая колонка) и желаемый вывод (правая колонка):
| Код | Вывод на экран |
|---|---|
|
|
Скорее всего, ваш код будет выглядеть примерно так:
| Код программы |
|---|
|
Такой код не слишком читабельный. Более того, если бы имена переменных были длиннее, код стал бы еще сложнее:
| Код программы |
|---|
|
Не очень читаемо, не так ли?
Однако в реальных программах такая ситуация встречается часто, поэтому я хочу рассказать о способе, как проще и короче записать этот код.
String.format
У класса String есть статический метод format(): он позволяет задать шаблон объединения строки с данными. Общий вид этой команды такой:
String имя = String.format(шаблон, параметры);
Пример:
| Код | Результат |
|---|---|
|
|
|
|
|
|
В метод format() первым параметром передают строку-шаблон, которая содержит весь нужный текст, а в местах, где нужно вставлять данные, написаны специальные символы типа %d, %s и т.п.
Вот эти %s и %d метод format() и заменяют на параметры, которые идут следом за строкой-шаблоном. Если нужно подставить строку, мы пишем %s, если число — %d. Пример:
| Код | Результат |
|---|---|
|
s будет равна "a=1, b=4, c=3" |
Вот краткий список параметров, которые можно использовать внутри шаблона:
| Символ | Обозначение |
|---|---|
|
String |
|
целое число: byte, short, int, long |
|
вещественное число: float, double |
|
boolean |
|
char |
|
Date |
|
Символ % |
Эти параметры указывают на тип данных, но есть еще параметры, которые указывают на порядок данных. Чтобы взять параметр по его номеру (нумерация начинается с единицы), нужно записать %1$d вместо %d. Пример:
| Код | Результат |
|---|---|
|
s будет равна "a=13, b=12, c=11" |
%3$d возьмет 3-й параметр-переменную, %2$d возьмет второй параметр. %d возьмет самый первый параметр-переменную. Параметры шаблона %s, %d обращаются к переменным-параметрам независимо от параметров шаблона типа %3$d или %2$s
3. String Pool
Все строки, которые были заданы в коде в виде литералов, во время работы программы хранятся в памяти в так называемом StringPool. StringPool — это специальный массив для хранения строк. Цель его создания — оптимизация хранения строк:
Во-первых, строки, заданные в коде, нужно все-таки где-то хранить. Код — это команды, а данные (тем более такие большие как строки) нужно хранить в памяти отдельно от кода. В коде фигурируют только ссылки на объекты-строки.
Во-вторых, все одинаковые литералы можно хранить в памяти только один раз. Так оно и работает. Когда код вашего класса загружается Java-машиной, все строковые литералы добавляются в StringPool, если их там еще нет. Если уже есть, просто используется ссылка на строку из StringPool.
Поэтому если в своем коде вы присвоите нескольким String-переменным одинаковые литералы, переменные будут содержать одинаковые ссылки. В StringPool литерал будет добавлен только один раз, во всех остальных случаях будет браться ссылка на уже загруженную в StringPool строку.
Как это примерно работает:
| Код | Работа с StringPool |
|---|---|
|
|
Именно поэтому переменные a и b будут хранить одинаковые ссылки.
Метод intern()
Ну и самое интересное: вы можете программно добавить любую строку в StringPool. Для этого нужно просто вызвать метод intern() у String-переменной.
Метод intern() добавит строку в StringPool, если ее еще там нет, и вернет ссылку на строку из StringPool.
Если в StringPool добавить с помощью метода intern() две идентичные строки, метод вернет одинаковые ссылки. Это можно использовать чтобы сравнивать строки по ссылке. Пример:
| Код | Примечание |
|---|---|
|
|
|
|
Вряд ли вы будете часто пользоваться этим методом, однако о нем любят спрашивать на собеседованиях, поэтому лучше о нем знать, чем не знать.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ