deep-learning-algo-impls/layers_8hpp_source.html

#pragma once


#include <memory>

#include <vector>

#include <functional>

#include "utils/autograd.hpp"

#include "utils/matrix.hpp"


namespace dl::layers {

    using utils::Variable;

    using utils::VariableD;

    using utils::VariableF;

    using utils::Matrix;

    using utils::MatrixD;

    using utils::MatrixF;


    template<typename T>


    class Module {

    public:

        virtual ~Module() = default;


        virtual Variable<T> forward(const Variable<T>& input) = 0;


        virtual std::vector<Variable<T>*> parameters() = 0;


        virtual void zero_grad() {

            for (auto* param : parameters()) {

                param->zero_grad();

            }

        }


        virtual void train(bool training = true) {

            training_ = training;

        }


        virtual void eval() {

            train(false);

        }


        bool is_training() const { return training_; }


    protected:

        bool training_ = true;

    };


    template<typename T>


    class Linear : public Module<T> {

    public:

        Linear(size_t in_features, size_t out_features, bool bias = true);


        Variable<T> forward(const Variable<T>& input) override;


        std::vector<Variable<T>*> parameters() override;


        // Getters for parameters

        Variable<T>& weight() { return weight_; }

        Variable<T>& bias() { return bias_; }

        const Variable<T>& weight() const { return weight_; }

        const Variable<T>& bias() const { return bias_; }


    private:

        Variable<T> weight_;  // Shape: (out_features, in_features)

        Variable<T> bias_;    // Shape: (out_features,)

        bool has_bias_;

        size_t in_features_;

        size_t out_features_;


        void initialize_parameters();

    };


    template<typename T>


    class ReLU : public Module<T> {

    public:

        Variable<T> forward(const Variable<T>& input) override;

        std::vector<Variable<T>*> parameters() override { return {}; }

    };


    template<typename T>


    class Sigmoid : public Module<T> {

    public:

        Variable<T> forward(const Variable<T>& input) override;

        std::vector<Variable<T>*> parameters() override { return {}; }

    };


    template<typename T>


    class Tanh : public Module<T> {

    public:

        Variable<T> forward(const Variable<T>& input) override;

        std::vector<Variable<T>*> parameters() override { return {}; }

    };


    template<typename T>


    class Dropout : public Module<T> {

    public:

        explicit Dropout(T p = 0.5) : p_(p) {}


        Variable<T> forward(const Variable<T>& input) override;

        std::vector<Variable<T>*> parameters() override { return {}; }


    private:

        T p_;  // Dropout probability

    };


    template<typename T>


    class Sequential : public Module<T> {

    public:

        void add_module(std::shared_ptr<Module<T>> module);


        Variable<T> forward(const Variable<T>& input) override;


        std::vector<Variable<T>*> parameters() override;


        void zero_grad() override;


        void train(bool training = true) override;


    private:

        std::vector<std::shared_ptr<Module<T>>> modules_;

    };


    // Type aliases for convenience

    using LinearD = Linear<double>;

    using LinearF = Linear<float>;

    using ReLUD = ReLU<double>;

    using ReLUF = ReLU<float>;

    using SigmoidD = Sigmoid<double>;

    using SigmoidF = Sigmoid<float>;

    using TanhD = Tanh<double>;

    using TanhF = Tanh<float>;

    using DropoutD = Dropout<double>;

    using DropoutF = Dropout<float>;

    using SequentialD = Sequential<double>;

    using SequentialF = Sequential<float>;


} // namespace dl::layers


autograd.hpp
PyTorch-like automatic differentiation engine.

dl::layers::Dropout
Dropout layer for regularization.
Definition layers.hpp:154

dl::layers::Dropout::Dropout
Dropout(T p=0.5)
Constructor.
Definition layers.hpp:160

dl::layers::Dropout::parameters
std::vector< Variable< T > * > parameters() override
Get all parameters of this module.
Definition layers.hpp:163

dl::layers::Dropout::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:93

dl::layers::Linear
Linear (fully connected) layer: y = xW^T + b.
Definition layers.hpp:82

dl::layers::Linear::bias
const Variable< T > & bias() const
Definition layers.hpp:108

dl::layers::Linear::weight
const Variable< T > & weight() const
Definition layers.hpp:107

dl::layers::Linear::weight
Variable< T > & weight()
Definition layers.hpp:105

dl::layers::Linear::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass: y = xW^T + b.
Definition layers.cpp:38

dl::layers::Linear::bias
Variable< T > & bias()
Definition layers.hpp:106

dl::layers::Linear::parameters
std::vector< Variable< T > * > parameters() override
Get parameters (weight and bias)
Definition layers.cpp:54

dl::layers::Module
Base class for all neural network modules (PyTorch-like nn.Module)
Definition layers.hpp:28

dl::layers::Module::eval
virtual void eval()
Set evaluation mode.
Definition layers.hpp:65

dl::layers::Module::train
virtual void train(bool training=true)
Set training mode.
Definition layers.hpp:58

dl::layers::Module::is_training
bool is_training() const
Check if module is in training mode.
Definition layers.hpp:72

dl::layers::Module::~Module
virtual ~Module()=default

dl::layers::Module::training_
bool training_
Definition layers.hpp:75

dl::layers::Module::zero_grad
virtual void zero_grad()
Zero gradients of all parameters.
Definition layers.hpp:48

dl::layers::Module::forward
virtual Variable< T > forward(const Variable< T > &input)=0
Forward pass through the module.

dl::layers::Module::parameters
virtual std::vector< Variable< T > * > parameters()=0
Get all parameters of this module.

dl::layers::ReLU
ReLU activation function.
Definition layers.hpp:124

dl::layers::ReLU::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:68

dl::layers::ReLU::parameters
std::vector< Variable< T > * > parameters() override
Get all parameters of this module.
Definition layers.hpp:127

dl::layers::Sequential
Sequential container for chaining modules.
Definition layers.hpp:173

dl::layers::Sequential::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through all modules in sequence.
Definition layers.cpp:121

dl::layers::Sequential::add_module
void add_module(std::shared_ptr< Module< T > > module)
Add a module to the sequence.
Definition layers.cpp:116

dl::layers::Sequential::parameters
std::vector< Variable< T > * > parameters() override
Get parameters from all modules.
Definition layers.cpp:133

dl::layers::Sequential::train
void train(bool training=true) override
Set training mode for all modules.
Definition layers.cpp:150

dl::layers::Sequential::zero_grad
void zero_grad() override
Zero gradients for all modules.
Definition layers.cpp:143

dl::layers::Sigmoid
Sigmoid activation function.
Definition layers.hpp:134

dl::layers::Sigmoid::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:75

dl::layers::Sigmoid::parameters
std::vector< Variable< T > * > parameters() override
Get all parameters of this module.
Definition layers.hpp:137

dl::layers::Tanh
Tanh activation function.
Definition layers.hpp:144

dl::layers::Tanh::forward
Variable< T > forward(const Variable< T > &input) override
Forward pass through the module.
Definition layers.cpp:82

dl::layers::Tanh::parameters
std::vector< Variable< T > * > parameters() override
Get all parameters of this module.
Definition layers.hpp:147

utils::Matrix
Definition matrix.hpp:46

utils::Variable
Variable class that supports automatic differentiation.
Definition autograd.hpp:58

matrix.hpp
Matrix utility class for deep learning operations.

dl::layers
Definition layers.hpp:16