Выбрать главу

void suffix_text( vectorstring,allocator *words )

{

vectorstring,allocator::iterator

iter = words-begin(),

iter_end = words-end();

while ( iter != iter_end ) {

// оставим слова короче трех букв как есть

if ( (*iter).size() = 3 )

{ ++iter; continue; }

if ( (*iter)[ (*iter).size()-1 ] == 's' )

suffix_s( *iter );

// здесь мы могли бы обработать суффиксы

// ed, ing, 1y

++iter;

}

}

Слова из трех и менее букв мы пропускаем. Это позволяет оставить без изменения, например, has, its, is и т.д., однако слова tv и tvs мы не сможем распознать как одинаковые.

Если слово кончается на "ies", как babies и cries, необходимо заменить "ies" на "y":

string::size_type pos() = word.size()-3;

string ies( "ies" );

if ( ! word.compare( pos3, 3, ies )) {

word.replace( pos3, 3, 1, 'у' );

return;

}

compare() возвращает 0, если две строки равны. Первый аргумент, pos3, обозначает начальную позицию, второй – длину сравниваемой подстроки (в нашем случае 3). Третий аргумент, ies, – строка-эталон. (На самом деле существует шесть вариантов функции compare(). Остальные мы покажем в следующем разделе.)

replace() заменяет подстроку набором символов. В данном случае мы заменяем подстроку "ies" длиной в 3 символа единичным символом 'y'. (Имеется десять перегруженных вариантов функции replace(). В следующем разделе мы коснемся остальных вариантов.)

Если слово заканчивается на "ses", как promises или purposes, нужно удалить суффикс "es" :

string ses( "ses" );

if ( ! word.compare( pos3, 3, ses )) {

word.erase( pos3+l, 2 );

return;

}

Если слово кончается на "ous", как oblivious, fulvous, cretaceous, или на "is", как genesis, mimesis, hepatitis, мы не будем изменять его. (Наша система несовершенна. Например, в слове kiwis надо убрать последнее 's'.) Пропустим и слова, оканчивающиеся на "ius" (genius) или на "ss" (hiss, lateness, less). Нам поможет вторая форма функции compare():

string::size_type spos = 0;

string::size_type pos3 = word.size()-3;

// "ous", "ss", "is", "ius"

string suffixes( "oussisius" );

if ( ! word.compare( pos3, 3, suffixes, spos, 3 ) || // ous

! word.compare( pos3, 3, suffixes, spos+6, 3 ) || // ius

! word.compare( pos3+l, 2, suffixes, spos+2, 2 ) || // ss

! word.compare( pos3+l, 2, suffixes, spos+4, 2 ) ) // is

return;

В противном случае удалим последнее 's':

// удалим последнее 's'

word.erase( pos3+2 );

Имена собственные, например Pythagoras, Brahms, Burne-Jones, не подпадают под общие правила. Этот случай мы оставим как упражнение для читателя, когда будем рассказывать об ассоциативных контейнерах.

Но прежде чем перейти к ним, рассмотрим оставшиеся строковые операции.

Упражнение 6.17

Наша программа не умеет обрабатывать суффиксы ed (surprised), ly (surprisingly) и ing (surprisingly). Реализуйте одну из функций для этого случая:

(a) suffix_ed() (b) suffix_ly() (c) suffix_ing()

6.11. Дополнительные операции со строками

Вторая форма функции-члена erase() принимает в качестве параметров два итератора, ограничивающих удаляемую подстроку. Например, превратим

string name( "AnnaLiviaPlurabelle" );

в строку "Annabelle":

typedef string::size_type size_type;

size_type startPos = name.find( 'L' )

size_type endPos = name.find_1ast_of( 'b' );

name.erase( name.begin()+startPos,

name.begin()+endPos );

Символ, на который указывает второй итератор, не входит в удаляемую подстроку.

Для третьей формы параметром является только один итератор; эта форма удаляет все символы, начиная с указанной позиции до конца строки. Например:

name.erase( name. begin()+4 );

оставляет строку "Anna".

Функция-член insert() позволяет вставить в заданную позицию строки другую строку или символ. Общая форма выглядит так:

string_object.insert( position, new_string );

position обозначает позицию, перед которой производится вставка. new_string может быть объектом класса string, C-строкой или символом:

string string_object( "Missisippi" );

string::size_type pos = string_object.find( "isi" );

string_object.insert( pos+1, 's' );

Можно выделить для вставки подстроку из new_string:

string new_string ( "AnnaBelle Lee" );

string_object += ' '; // добавим пробел

// найдем начальную и конечную позицию в new_string

pos = new_string.find( 'B' );

string::size_type posEnd = new_string.find( ' ' );

string_object.insert(

string_object.size(), // позиция вставки

new_string, pos, // начало подстроки в new_string

posEnd // конец подстроки new_string