С таким введением, давайте посмотрим на код. Строка 7 устанавливает uval, которая является беззнаковой версией форматируемого значения. ii и jj отслеживают положение в loc.grouping и число цифр в текущей группе, которые были преобразованы, соответственно[142]. quote_flag равен true, когда в спецификации преобразования был отмечен символ '.
Цикл do-while генерирует символы цифр в обратном порядке, заполняя буфер с конца к началу. Каждая цифра создается в строке 11. Затем строка 25 делится на 10 путем смещения значения вправо на одну десятичную цифру.
Нас интересуют строки 12–24. Эта работа осуществляется только на системе, поддерживающей локали, на что указывает наличие заголовочного файла <locale.h>. Именованная константа HAVE_LOCALE в такой системе будет равна true[143].
Когда условие в строке 13 истинно, настало время добавить символ разделителя тысяч. Это условие можно прочесть как «если требуется группировка и текущее положение в loc.grouping указывает нужное для группировки количество и текущее число цифр равно группируемому количеству». Если это условие истинно, строка 14 добавляет символ разделителя тысяч. Комментарий обращает внимание на предположение, которое, вероятно, истинно, но которое может вновь появиться позже. ('XXX' является традиционным способом выделения опасного или сомнительного кода. Его легко отыскать, и он весьма заметен для читателя кода.)
После использования текущего положения в loc.grouping строки 15–22 заглядывают в значение в следующем положении. Если это 0, продолжает использоваться значение текущего положения. Мы указываем на это, восстанавливая 0 в jj (строка 16). С другой стороны, если в следующем положении CHAR_MAX, группировка должна быть прекращена, и строка 18 убирает ее, устанавливая quote_flag в false. В противном случае, следующее значение является значением группировки, поэтому строка 20 восстанавливает 0 в jj, а строка 21 увеличивает значение ii.
Это низкоуровневый, подробный код. Однако, поняв один раз, как представляется информация в struct lconv, код читать просто (и его было просто писать).
13.2.7. Форматирование значений даты и времени: ctime() и strftime()
В разделе 6.1 «Времена и даты» описаны функции для получения и форматирования значений времени и даты. Функция strftime() также может использовать локаль, если setlocale() была вызвана должным образом. Это демонстрирует следующая простая программа, ch13-times.с:
/* ch13-times.c --- демонстрация времени на основе локали */
#include <stdio.h>
#include <locale.h>
#include <time.h>
int main(void) {
char buf[100];
time_t now;
struct tm *curtime;
setlocale(LC_ALL, "");
time(&now);
curtime = localtime(&now);
(void)strftime(buf, sizeof buf,
"It is now %A, %B %d, %Y, %I:%M %p", curtime);
printf("%s\n", buf);
printf("ctime() says: %s", ctime(&now));
exit(0);
}
При запуске программы мы видим, что результаты strftime() в самом деле варьируют, тогда как результаты ctime() — нет:
$ LC_ALL=en_US ch13-times /* Время в Соединенных Штатах */
It is now Friday, July 11, 2003, 10:35 AM
ctime() says: Fri Jul 11 10:35:55 2003
$ LC_ALL=it_IT ch13-times /* Время в Италии */
It is now venerdi, luglio 11, 2003, 10:36
ctime() says: Fri Jul 11 10:36:00 2003
$ LC_ALL=fr_FR ch13-times /* Время во Франции */
It is now vendredi, juillet 11, 2003, 10:36
ctime() says: Fri Jul 11 10:36:05 2003
Причина отсутствия изменений в том, что ctime() (и asctime(), на которой основана ctime()) является традиционным интерфейсом; он существует для поддержки старого кода, strftime(), будучи более новым интерфейсом (первоначально разработанным для C89), свободен использовать локали.
13.2.8. Другие данные локали: nl_langinfo()
Хотя ранее мы сказали, что API catgets() трудно использовать, одна часть этого API обычно полезна: nl_langinfo(). Она предоставляет дополнительные связанные с локалью сведения, помимо тех, которые доступны из struct lconv:
#include <nl_types.h>
#include <langinfo.h>
char *nl_langinfo(nl_item item);
Заголовочный файл <nl_types.h> определяет тип nl_item. (Это скорее всего int или enum.) Параметр item является одной из именованных констант, определенных в <langinfo.h>. Возвращаемое значение является строкой, которую можно при необходимости использовать либо непосредственно, либо в качестве форматирующей строки для strftime().
Доступная информация поступает из нескольких категорий локали. В табл. 13.3 перечислены константы элементов, соответствующие категории локали и их значения.
Таблица 13.3. Значения элементов для nl_langinfo()
| Элемент | Категория | Значение |
|---|---|---|
ABDAY_1, …, ABDAY_7 |
LC_TIME |
Сокращенные названия дней недели. Воскресенье является днем 1 |
ABMON_1, …, ABMON_12 |
LC_TIME |
Сокращенные названия месяцев |
ALT_DIGITS |
LC_TIME |
Альтернативные символы для цифр; см. текст |
AM_STR, PM_STR |
LC_TIME |
Обозначения a.m/p.m. для локали. |
CODESET |
LC_TYPE |
Имя кодовой страницы для локали, т.е. использующиеся набор символов и кодировка |
CRNCYSTR |
LC_MONETARY |
Символ местной валюты, описанный ниже |
DAY_1, …, DAY_7 |
LC_TIME |
Названия дней недели. Воскресенье является днем 1 |
D_FMT |
LC_TIME |
Формат даты |
D_T_FMT |
LC_TIME |
Формат даты и времени |
ERA_D_FMT |
LC_TIME |
Формат даты эры. |
ERA_D_T_FMT |
LC_TIME |
Формат даты и времени эры. |
ERA_T_FMT |
LC_TIME |
Формат времени эры. |
ERA |
LC_TIME |
Сегменты описания эры, см. текст. |
MON_1, …, MON_12 |
LC_TIME |
Названия месяцев. |
RADIXCHAR |
LC_NUMERIC |
Символ системы счисления. Для базы 10 это символ точки в десятичной дроби. |
THOUSEP |
LC_NUMERIC |
Символ-разделитель тысяч |
T_FMT_AMPM |
LC_TIME |
Формат времени в записи a.m/p.m. |
T_FMT |
LC_TIME |
Формат времени. |
YESEXPR, NOEXPR |
LC_MESSAGES |
Строка, представляющая положительный и отрицательный ответы. |
142
Нам, вероятно, следовало выбрать более осмысленные имена вместо простых ii и jj, поскольку использующий их код короткий, отсутствие у нас воображения не представляет значительной проблемы —
143
Это устанавливается механизмом Autoconf и Automake. Autoconf и Automake являются мощными программными наборами, дающими возможность поддержки широкого круга Unix-систем систематическим образом —