docs/sourcecode_2tpglibs_2src_2AVXRunSumProcessor_8cpp_source.html

#include "tpglibs/AVXRunSumProcessor.hpp"


namespace tpglibs {


REGISTER_AVXPROCESSOR_CREATOR("AVXRunSumProcessor", AVXRunSumProcessor)


void AVXRunSumProcessor::configure(const nlohmann::json& config, const int16_t* plane_numbers) {

  // Configure common metric collection parameters

  // Register pointers to the ACTUAL member variables, not copies

  // Use shared_ptr with no-op deleter to avoid double-free

  m_internal_state_name_registry.register_internal_state("r",

    std::shared_ptr<__m256i>(&m_memory_factor, [](auto*){}));

  m_internal_state_name_registry.register_internal_state("s",

    std::shared_ptr<__m256i>(&m_scale_factor, [](auto*){}));

  m_internal_state_name_registry.register_internal_state("rs",

    std::shared_ptr<__m256i>(&m_running_sum, [](auto*){}));


  configure_internal_state_collection(config);


  int16_t memory_factors[16];

  int16_t plane_memory_factors[3] = {config["memory_factor_plane0"],

                                     config["memory_factor_plane1"],

                                     config["memory_factor_plane2"]};

  int16_t memory_divisors[16];

  int16_t plane_memory_divisors[3] = {config["memory_divisor_plane0"],

                                      config["memory_divisor_plane1"],

                                      config["memory_divisor_plane2"]};

  int16_t scale_factors[16];

  int16_t plane_scale_factors[3]  = {config["scale_factor_plane0"],

                                     config["scale_factor_plane1"],

                                     config["scale_factor_plane2"]};

  int16_t scale_divisors[16];

  int16_t plane_scale_divisors[3] = {config["scale_divisor_plane0"],

                                     config["scale_divisor_plane1"],

                                     config["scale_divisor_plane2"]};


  for (int i = 0; i < 16; i++) {

    memory_factors[i] = plane_memory_factors[plane_numbers[i]];

    memory_divisors[i] = 0x7FFF / plane_memory_divisors[plane_numbers[i]];  // Need to adjust for AVX2 usage.

    scale_factors[i] = plane_scale_factors[plane_numbers[i]];

    scale_divisors[i] = 0x7FFF / plane_scale_divisors[plane_numbers[i]];  // Need to adjust for AVX2 usage.

  }


  m_memory_factor = _mm256_lddqu_si256(reinterpret_cast<__m256i*>(memory_factors));

  m_memory_divisor = _mm256_lddqu_si256(reinterpret_cast<__m256i*>(memory_divisors));

  m_scale_factor = _mm256_lddqu_si256(reinterpret_cast<__m256i*>(scale_factors));

  m_scale_divisor = _mm256_lddqu_si256(reinterpret_cast<__m256i*>(scale_divisors));

}


__m256i AVXRunSumProcessor::process(const __m256i& signal) {

  // Update sample counter and write internal states to buffer for harvesting

  m_samples++;

  if (m_collect_internal_state_flag && (m_samples % m_sample_period == 0)) {

    m_internal_state_buffer_manager.write_to_active_buffer();

  }


  __m256i scaled_rs = _mm256_mulhrs_epi16(m_running_sum, m_memory_divisor);

  scaled_rs = _mm256_mullo_epi16(scaled_rs, m_memory_factor);


  __m256i scaled_signal = _mm256_mulhrs_epi16(signal, m_scale_divisor);

  scaled_signal = _mm256_mullo_epi16(scaled_signal, m_scale_factor);


  m_running_sum = _mm256_adds_epi16(scaled_rs, scaled_signal);

  return AVXProcessor::process(m_running_sum);

}


} // namespace tpglibs

REGISTER_AVXPROCESSOR_CREATOR
#define REGISTER_AVXPROCESSOR_CREATOR(processor_name, processor_class)
Factory registration macro.
Definition AVXFactory.hpp:16

tpglibs::AVXProcessor::process
virtual __m256i process(const __m256i &signal) override
Simple signal pass-through on __m256i type.
Definition AVXProcessor.hpp:26

tpglibs::AVXRunSumProcessor
AVX signal processor: Calculates the running sum of the signal.
Definition AVXRunSumProcessor.hpp:26

tpglibs::AVXRunSumProcessor::process
__m256i process(const __m256i &signal) override
Calculate and store the running sum.
Definition AVXRunSumProcessor.cpp:58

tpglibs::AVXRunSumProcessor::m_memory_divisor
__m256i m_memory_divisor
The divisor for the R factor.
Definition AVXRunSumProcessor.hpp:40

tpglibs::AVXRunSumProcessor::m_memory_factor
__m256i m_memory_factor
The R factor in the model equation.
Definition AVXRunSumProcessor.hpp:28

tpglibs::AVXRunSumProcessor::m_scale_divisor
__m256i m_scale_divisor
The divisor for the S factor.
Definition AVXRunSumProcessor.hpp:37

tpglibs::AVXRunSumProcessor::m_running_sum
__m256i m_running_sum
The RS in the model equation.
Definition AVXRunSumProcessor.hpp:34

tpglibs::AVXRunSumProcessor::m_scale_factor
__m256i m_scale_factor
The S factor in the model equation.
Definition AVXRunSumProcessor.hpp:31

tpglibs::AbstractProcessor< __m256i >::m_internal_state_buffer_manager
ProcessorInternalStateBufferManager< __m256i > m_internal_state_buffer_manager
Definition AbstractProcessor.hpp:32

tpglibs::AbstractProcessor< __m256i >::m_samples
std::atomic< uint64_t > m_samples
Definition AbstractProcessor.hpp:36

tpglibs::AbstractProcessor< __m256i >::m_sample_period
uint64_t m_sample_period
Definition AbstractProcessor.hpp:38

tpglibs::AbstractProcessor< __m256i >::m_collect_internal_state_flag
bool m_collect_internal_state_flag
Definition AbstractProcessor.hpp:37

tpglibs::ProcessorInternalStateBufferManager::write_to_active_buffer
void write_to_active_buffer()
Write to the active buffer.
Definition ProcessorInternalStateBufferManager.hpp:153

tpglibs
Definition AbstractFactory.hpp:20

AVXRunSumProcessor.hpp