Алгоритм БПФ по основанию 4 требует меньшего количества умножений с комплексными числами, но большего количества операций суммирования, чем БПФ по основанию 2 для такого же количества точек. По сравнению с алгоритмом БПФ по основанию 2, алгоритм по основанию 4 использует более сложную адресацию и дополнительные коэффициенты поворота, но меньшее количество вычислений. Окончательная экономия времени вычисления различается для разных DSP, но алгоритм БПФ по основанию 4 может быть более чем вдвое быстрым, чем алгоритм по основанию 2 для DSP с оптимальной архитектурой.
В общем случае, требования по используемой памяти для N-точечного БПФ следующие:
N ячеек для вещественных данных, N ячеек для мнимых данных и N ячеек для синусоидальных базисных функций (иногда упоминаемых, как коэффициенты поворота). Дополнительные ячейки памяти будут требоваться в случае использования взвешивания с использованием оконных функций (windowing). Если принятые требования по памяти удовлетворены, DSP должен выполнить необходимые вычисления за требуемое время. Многие производители DSP либо проводят тест производительности для указанного размера БПФ, либо определяют время вычисления для базовой операции «бабочка». При сравнении характеристик БПФ важно удостовериться, что во всех случаях используется одинаковый тип БПФ. Например, тест 1024-точечного БПФ на одном DSP, полученном с помощью алгоритма БПФ по основанию 2, не должен сравниваться с тестом алгоритма БПФ по основанию 4 для другого DSP.
Другое соображение относительно БПФ заключается в выборе процессора с фиксированной или с плавающей точкой. Значения, соответствующие результатам вычисления «бабочки», могут быть больше, чем исходные данные при вычислении «бабочки». Это увеличение обрабатываемых числовых значений может создавать потенциальную проблему в DSP с фиксированным числом разрядов. Для предотвращения переполнения, данные следует масштабировать, заранее оставляя достаточное количество дополнительных разрядов для увеличения значений обрабатываемых данных. Альтернативный метод заключается в том, что данные могут масштабироваться после каждого каскада вычисления БПФ. Методика масштабирования данных после каждого прохода БПФ известна как блочная плавающая точка (block floating point). Он называется так, потому что полный массив данных масштабируется как единое целое, независимо от того, действительно ли каждый элемент в блоке требует масштабирования. Блок масштабируется таким образом, чтобы относительные соотношения между данными остались прежними. Например, если каждое слово данных сдвинуто вправо на один разряд (поделено на 2), абсолютные значения изменяются, но относительно друг друга соотношения данных остаются прежними.
В 16-разрядном DSP-процессоре с фиксированной точкой после умножения формируется 32-разрядное слово. Семейство цифровых сигнальных процессоров Analog Devices ADSP21xx характеризуется расширенным динамическим диапазоном, который реализуется в операциях умножения с накоплением посредством 40-разрядного внутреннего регистра аккумулятора.
Использование DSP-процессора с плавающей точкой устраняет потребность в масштабировании данных и поэтому приводит к более простой реализации алгоритма БПФ, но следствием этого упрощения является увеличение времени обработки, которое требуется для сложных арифметических вычислений с плавающей точкой. Кроме того, 32-разрядный DSP-процессор с плавающей точкой, очевидно, будет иметь меньший уровень шумов округления, чем 16-разрядный DSP-процессор с фиксированной точкой. На рис. 5.22 приведены данные по реализации БПФ для популярных DSP-процессоров Analog Devices. В частности, что DSP-процессор ADSP-TS001 TigerSHARC™ предлагает оба режима: и с плавающей, и с фиксированной точкой, обеспечивая, таким образом, исключительную гибкость программирования.
Существует два основных способа обработки сигналов в реальном масштабе времени: обработка одного отсчета в каждый момент времени (непрерывная обработка) и обработка одного пакета данных в каждый момент времени (пакетная обработка). Системы, основанные на непрерывной обработке, такие как цифровой фильтр, получают данные в виде одного отсчета в каждый момент времени. В каждом такте новый отсчет поступает в систему, а обработанный отсчет передается на выход. Системы, основанные на пакетной обработке, такие как построенный на БПФ цифровой анализатор спектра, получают данные в виде целого пакета отсчетов. Происходит обработка всего пакета исходных данных, результатом которой является пакет преобразованных выходных данных.