deep-learning-algo-impls/layers_8cpp_source.html

#include "neural_network/layers.hpp"

#include <stdexcept>

#include <random>

#include <algorithm>


namespace dl::layers {


    // ============================================================================

    // Linear Layer Implementation

    // ============================================================================


    template<typename T>


    Linear<T>::Linear(size_t in_features, size_t out_features, bool bias)

        : in_features_(in_features), out_features_(out_features), has_bias_(bias),

          weight_(Matrix<T>(out_features, in_features), true),

          bias_(Matrix<T>(out_features, 1), true) {

        initialize_parameters();

    }


    template<typename T>

    void Linear<T>::initialize_parameters() {

        // TODO: Implement Xavier/He initialization

        // Hint: Use normal distribution with appropriate variance

        // Xavier: std = sqrt(2.0 / (in_features + out_features))

        // He: std = sqrt(2.0 / in_features)


        // Placeholder: Initialize with small random values

        std::random_device rd;

        std::mt19937 gen(rd());

        T std_dev = std::sqrt(2.0 / (in_features_ + out_features_));

        std::normal_distribution<T> dist(0.0, std_dev);


        // TODO: Fill weight_ matrix with random values

        // TODO: Initialize bias_ to zeros if has_bias_ is true

    }


    template<typename T>


    Variable<T> Linear<T>::forward(const Variable<T>& input) {

        // TODO: Implement forward pass: y = xW^T + b

        // Steps:

        // 1. Compute input.dot(weight_.transpose())

        // 2. Add bias if has_bias_ is true

        // 3. Return result


        // Placeholder implementation

        Variable<T> output = input.dot(weight_.transpose());

        if (has_bias_) {

            output = output + bias_;

        }

        return output;

    }


    template<typename T>


    std::vector<Variable<T>*> Linear<T>::parameters() {

        std::vector<Variable<T>*> params;

        params.push_back(&weight_);

        if (has_bias_) {

            params.push_back(&bias_);

        }

        return params;

    }


    // ============================================================================

    // Activation Functions Implementation

    // ============================================================================


    template<typename T>


    Variable<T> ReLU<T>::forward(const Variable<T>& input) {

        // TODO: Implement ReLU activation

        // Hint: Use input.relu() method from autograd

        return input.relu();

    }


    template<typename T>


    Variable<T> Sigmoid<T>::forward(const Variable<T>& input) {

        // TODO: Implement Sigmoid activation

        // Hint: Use input.sigmoid() method from autograd

        return input.sigmoid();

    }


    template<typename T>


    Variable<T> Tanh<T>::forward(const Variable<T>& input) {

        // TODO: Implement Tanh activation

        // Hint: Use input.tanh() method from autograd

        return input.tanh();

    }


    // ============================================================================

    // Dropout Implementation

    // ============================================================================


    template<typename T>


    Variable<T> Dropout<T>::forward(const Variable<T>& input) {

        // TODO: Implement dropout

        // During training:

        //   - Generate random mask with probability p_

        //   - Multiply input by mask

        //   - Scale by 1/(1-p_) to maintain expected value

        // During evaluation:

        //   - Return input unchanged


        if (!this->is_training()) {

            return input;

        }


        // TODO: Implement training mode dropout

        // Placeholder: return input unchanged

        return input;

    }


    // ============================================================================

    // Sequential Container Implementation

    // ============================================================================


    template<typename T>


    void Sequential<T>::add_module(std::shared_ptr<Module<T>> module) {

        modules_.push_back(module);

    }


    template<typename T>


    Variable<T> Sequential<T>::forward(const Variable<T>& input) {

        // TODO: Implement sequential forward pass

        // Apply each module in sequence to the input


        Variable<T> output = input;

        for (auto& module : modules_) {

            output = module->forward(output);

        }

        return output;

    }


    template<typename T>


    std::vector<Variable<T>*> Sequential<T>::parameters() {

        std::vector<Variable<T>*> all_params;

        for (auto& module : modules_) {

            auto module_params = module->parameters();

            all_params.insert(all_params.end(), module_params.begin(), module_params.end());

        }

        return all_params;

    }


    template<typename T>


    void Sequential<T>::zero_grad() {

        for (auto& module : modules_) {

            module->zero_grad();

        }

    }


    template<typename T>


    void Sequential<T>::train(bool training) {

        Module<T>::train(training);

        for (auto& module : modules_) {

            module->train(training);

        }

    }


    // ============================================================================

    // Explicit Template Instantiations

    // ============================================================================


    template class Linear<float>;

    template class Linear<double>;

    template class ReLU<float>;

    template class ReLU<double>;

    template class Sigmoid<float>;

    template class Sigmoid<double>;

    template class Tanh<float>;

    template class Tanh<double>;

    template class Dropout<float>;

    template class Dropout<double>;

    template class Sequential<float>;

    template class Sequential<double>;


} // namespace dl::layers

dl::layers::Dropout
Dropout layer for regularization.
Definition layers.hpp:154

dl::layers::Dropout::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:93

dl::layers::Linear
Linear (fully connected) layer: y = xW^T + b.
Definition layers.hpp:82

dl::layers::Linear::Linear
Linear(size_t in_features, size_t out_features, bool bias=true)
Constructor.
Definition layers.cpp:13

dl::layers::Linear::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass: y = xW^T + b.
Definition layers.cpp:38

dl::layers::Linear::parameters
std::vector< Variable< T > * > parameters() override
Get parameters (weight and bias)
Definition layers.cpp:54

dl::layers::Module
Base class for all neural network modules (PyTorch-like nn.Module)
Definition layers.hpp:28

dl::layers::Module::train
virtual void train(bool training=true)
Set training mode.
Definition layers.hpp:58

dl::layers::ReLU
ReLU activation function.
Definition layers.hpp:124

dl::layers::ReLU::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:68

dl::layers::Sequential
Sequential container for chaining modules.
Definition layers.hpp:173

dl::layers::Sequential::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through all modules in sequence.
Definition layers.cpp:121

dl::layers::Sequential::add_module
void add_module(std::shared_ptr< Module< T > > module)
Add a module to the sequence.
Definition layers.cpp:116

dl::layers::Sequential::parameters
std::vector< Variable< T > * > parameters() override
Get parameters from all modules.
Definition layers.cpp:133

dl::layers::Sequential::train
void train(bool training=true) override
Set training mode for all modules.
Definition layers.cpp:150

dl::layers::Sequential::zero_grad
void zero_grad() override
Zero gradients for all modules.
Definition layers.cpp:143

dl::layers::Sigmoid
Sigmoid activation function.
Definition layers.hpp:134

dl::layers::Sigmoid::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:75

dl::layers::Tanh
Tanh activation function.
Definition layers.hpp:144

dl::layers::Tanh::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:82

utils::Matrix
Definition matrix.hpp:46

utils::Variable
Variable class that supports automatic differentiation.
Definition autograd.hpp:58

utils::Variable::sigmoid
Variable< T > sigmoid() const
Definition autograd.cpp:113

utils::Variable::dot
Variable< T > dot(const Variable< T > &other) const
Definition autograd.cpp:69

utils::Variable::tanh
Variable< T > tanh() const
Definition autograd.cpp:124

utils::Variable::relu
Variable< T > relu() const
Definition autograd.cpp:136

layers.hpp
PyTorch-like neural network layers with automatic differentiation.

dl::layers
Definition layers.hpp:16