d9/d35/base__convolution_8hpp_source.html

 // Copyright (c) 2014-2023, Lawrence Livermore National Security, LLC.
 // Produced at the Lawrence Livermore National Laboratory.
 // Written by the LBANN Research Team (B. Van Essen, et al.) listed in
 // the CONTRIBUTORS file. <lbann-dev@llnl.gov>
 //
 // LLNL-CODE-697807.
 // All rights reserved.
 //
 // This file is part of LBANN: Livermore Big Artificial Neural Network
 // Toolkit. For details, see http://software.llnl.gov/LBANN or
 // https://github.com/LLNL/LBANN.
 //
 // Licensed under the Apache License, Version 2.0 (the "Licensee"); you
 // may not use this file except in compliance with the License.  You may
 // obtain a copy of the License at:
 //
 // http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or
 // implied. See the License for the specific language governing
 // permissions and limitations under the license.

 #ifndef LBANN_LAYERS_LEARNING_BASE_CONVOLUTION_HPP_INCLUDED
 #define LBANN_LAYERS_LEARNING_BASE_CONVOLUTION_HPP_INCLUDED

 #include "lbann/layers/data_type_layer.hpp"
 #include "lbann/layers/layer.hpp"
 #ifdef LBANN_HAS_DNN_LIB
 #include "lbann/utils/dnn_lib/convolution.hpp"
 #include "lbann/utils/dnn_lib/helpers.hpp"
 #endif // LBANN_HAS_DNN_LIB
 #include "lbann/utils/memory.hpp"

 #include <vector>

 #ifdef LBANN_HAS_DISTCONV
 #include "distconv/dnn_backend/convolution.hpp"
 #include "lbann/utils/distconv.hpp"
 #endif

 namespace lbann {

 #ifdef LBANN_HAS_DISTCONV
 namespace dc {
 using Backend = ::distconv::BackendDNNLib;
 template <typename TensorDataType>
 using Convolution = ::distconv::Convolution<Backend, TensorDataType>;
 } // namespace dc

 template <typename TensorDataType, El::Device Device>
 class base_convolution_adapter
   : public data_type_distconv_adapter<TensorDataType>
 {
 public:
   using TensorDevType =
     typename data_type_distconv_adapter<TensorDataType>::TensorDevType;

   base_convolution_adapter(Layer& layer)
     : data_type_distconv_adapter<TensorDataType>(layer)
   {}
   virtual ~base_convolution_adapter() = default;

   void setup_fp_tensors() override;
   void setup_bp_tensors() override;
   void setup_layer(size_t workspace_capacity) override;
   std::unique_ptr<TensorDevType>
   setup_error_signals_i(int index) const override;

   void fp_compute_convolution();
   void fp_apply_bias();

   void bp_compute_convolution_data();
   void bp_compute_convolution_filter();

   std::unique_ptr<dc::Convolution<TensorDataType>> m_conv;
   std::unique_ptr<TensorDevType> m_kernel;
   std::unique_ptr<TensorDevType> m_bias;
   std::unique_ptr<TensorDevType> m_kernel_gradient;
   std::unique_ptr<TensorDevType> m_bias_gradient;

   std::string m_fwd_algo;
   std::string m_bwd_data_algo;
   std::string m_bwd_filter_algo;
 };
 #endif // LBANN_HAS_DISTCONV

 template <typename TensorDataType, El::Device Device>
 class base_convolution_layer : public data_type_layer<TensorDataType>
 {
 public:

   using WeightsType = data_type_weights<TensorDataType>;

   using OptimizerType = data_type_optimizer<TensorDataType>;

   template <El::Device D>
   using DMatDT = El::Matrix<TensorDataType, D>;

 #ifdef LBANN_HAS_DNN_LIB
   using ScalingType = dnn_lib::ScalingParamType<TensorDataType>;
 #else
   using ScalingType = TensorDataType;
 #endif // LBANN_HAS_DNN_LIB


   const std::vector<int>& get_conv_dims() const { return m_conv_dims; }
   const std::vector<int>& get_pads() const { return m_pads; }
   const std::vector<int>& get_strides() const { return m_strides; }
   const std::vector<int>& get_dilations() const { return m_dilations; }

 protected:
   int m_output_channels;
   std::vector<int> m_conv_dims;
   std::vector<int> m_pads;
   std::vector<int> m_strides;
   std::vector<int> m_dilations;
   int m_groups;

   ScalingType m_bias_scaling_factor;

 #ifdef LBANN_HAS_DNN_LIB

   dnn_lib::dnnMathType_t m_convolution_math_type =
     dnn_lib::get_default_convolution_math_type();
   dnn_lib::FilterDescriptor m_kernel_dnn_desc;
   dnn_lib::ConvolutionDescriptor m_convolution_dnn_desc;
   dnn_lib::TensorDescriptor m_bias_dnn_desc;
   dnn_lib::data_parallel_layer_tensor_manager<TensorDataType>
     m_tensors_dnn_desc;
   std::unordered_map<int, fwd_conv_alg> m_fwd_dnn_algos;
   std::unordered_map<int, bwd_data_conv_alg> m_bwd_data_dnn_algos;
   std::unordered_map<int, bwd_filter_conv_alg> m_bwd_filter_dnn_algos;

 #endif // LBANN_HAS_DNN_LIB

 public:
   base_convolution_layer(int num_data_dims,
                          int output_channels,
                          std::vector<int> conv_dims,
                          std::vector<int> pads,
                          std::vector<int> strides,
                          std::vector<int> dilations,
                          int groups,
                          bool has_bias);

   base_convolution_layer(const base_convolution_layer& other);

   base_convolution_layer& operator=(const base_convolution_layer& other);

   ~base_convolution_layer();

 #ifdef LBANN_HAS_DNN_LIB
   void set_dnn_math_mode(dnn_lib::dnnMathType_t math_type) noexcept;
 #endif // LBANN_HAS_DNN_LIB

   description get_description() const override;
   void setup_dims() override;

   void setup_data(size_t max_mini_batch_size) override;

   void setup_gpu() override;


   template <typename ArchiveT>
   void serialize(ArchiveT& ar);


 protected:
   virtual std::vector<int> get_kernel_dims() const = 0;

   void apply_convolution_dnn(bool during_forward_prop);

   void apply_transposed_convolution_dnn(bool during_forward_prop);

   void apply_bias_dnn();
   void compute_gradients_dnn(bool using_transposed_convolution);

   void apply_convolution_im2col(bool during_forward_prop);

   void apply_transposed_convolution_im2col(bool during_forward_prop);

   void apply_bias_cpu();

   void compute_gradients_im2col(bool using_transposed_convolution);

 private:
 #ifdef LBANN_HAS_DNN_LIB

   fwd_conv_alg
   get_forward_algo_dnn(const int local_mini_batch_size,
                        const dnn_lib::TensorDescriptor& input_desc,
                        const TensorDataType* input,
                        const dnn_lib::FilterDescriptor& kernel_desc,
                        const TensorDataType* kernel,
                        const dnn_lib::ConvolutionDescriptor& conv_desc,
                        const dnn_lib::TensorDescriptor& output_desc,
                        TensorDataType* output,
                        size_t ws_size,
                        TensorDataType* ws);

   bwd_data_conv_alg get_backward_data_algo_dnn(
     const int local_mini_batch_size,
     const dnn_lib::FilterDescriptor& kernel_desc,
     const TensorDataType* kernel,
     const dnn_lib::TensorDescriptor& prev_error_signal_desc,
     const TensorDataType* prev_error_signal,
     const dnn_lib::ConvolutionDescriptor& conv_desc,
     const dnn_lib::TensorDescriptor& error_signal_desc,
     TensorDataType* error_signal,
     size_t ws_size,
     TensorDataType* ws);

   bwd_filter_conv_alg get_backward_filter_algo_dnn(
     const int local_mini_batch_size,
     const dnn_lib::TensorDescriptor& input_desc,
     const TensorDataType* input,
     const dnn_lib::TensorDescriptor& prev_error_signal_desc,
     const TensorDataType* prev_error_signal,
     const dnn_lib::ConvolutionDescriptor& conv_desc,
     const dnn_lib::FilterDescriptor& kernel_gradient_desc,
     size_t ws_size,
     TensorDataType* ws);
 #endif // LBANN_HAS_DNN_LIB

 #ifdef LBANN_HAS_DISTCONV
   friend class base_convolution_adapter<TensorDataType, Device>;

 protected:
   using BaseConvAdapterType = base_convolution_adapter<TensorDataType, Device>;
   void setup_distconv_adapter() override;
   BaseConvAdapterType& get_distconv_adapter() override;
   const BaseConvAdapterType& get_distconv_adapter() const override;
 #endif // LBANN_HAS_DISTCONV
 };

 } // namespace lbann
 #endif // LBANN_LAYERS_LEARNING_BASE_CONVOLUTION_HPP_INCLUDED
lbann::data_type_weights
Definition: l2.hpp:41

lbann::base_convolution_layer::m_groups
int m_groups
Definition: base_convolution.hpp:140

lbann::base_convolution_layer::get_pads
const std::vector< int > & get_pads() const
Definition: base_convolution.hpp:119

lbann::base_convolution_layer::m_conv_dims
std::vector< int > m_conv_dims
Spatial dimensions for convolution kernel.
Definition: base_convolution.hpp:128

lbann::base_convolution_layer::m_bias_scaling_factor
ScalingType m_bias_scaling_factor
Definition: base_convolution.hpp:145

distconv.hpp

lbann::protobuf::serialize
void serialize(std::ostream &os, google::protobuf::Message const &msg)
Serialize the protobuf message to a stream.

lbann::description
Generates nicely formatted description messages.
Definition: description.hpp:49

lbann::dnn_lib::data_parallel_layer_tensor_manager
Definition: data_type_layer.hpp:52

lbann::Device
constexpr El::Device Device
Definition: OperatorTraits.hpp:62

lbann::bwd_data_conv_alg
bwd_data_conv_alg
Which backward convolution algorithm to use.
Definition: dnn_enums.hpp:45

lbann::bwd_filter_conv_alg
bwd_filter_conv_alg
Which backward convolution filter algorithm to use.
Definition: dnn_enums.hpp:57

lbann::base_convolution_layer::get_conv_dims
const std::vector< int > & get_conv_dims() const
Get convolutional layer parameters.
Definition: base_convolution.hpp:118

convolution.hpp

lbann::base_convolution_layer::get_dilations
const std::vector< int > & get_dilations() const
Definition: base_convolution.hpp:121

helpers.hpp

lbann::data_type_layer
Definition: data_type_layer.hpp:69

lbann::fwd_conv_alg
fwd_conv_alg
Which forward convolution algorithm to use.
Definition: dnn_enums.hpp:32

lbann::base_convolution_layer::m_dilations
std::vector< int > m_dilations
Definition: base_convolution.hpp:134

layer.hpp

lbann::base_convolution_layer::m_pads
std::vector< int > m_pads
Definition: base_convolution.hpp:130

lbann::base_convolution_layer::DMatDT
El::Matrix< TensorDataType, D > DMatDT
Definition: base_convolution.hpp:107

data_type_layer.hpp

lbann::data_type_optimizer
Definition: l2.hpp:39

lbann::base_convolution_layer::m_output_channels
int m_output_channels
Definition: base_convolution.hpp:124

lbann::base_convolution_layer::ScalingType
TensorDataType ScalingType
Definition: base_convolution.hpp:112

lbann::base_convolution_layer
Computation kernels for convolution and deconvolution layers.
Definition: base_convolution.hpp:94

lbann::base_convolution_layer::get_strides
const std::vector< int > & get_strides() const
Definition: base_convolution.hpp:120

memory.hpp

lbann
Definition: callback_helpers.hpp:32

lbann::data_type_distconv_adapter::TensorDevType
dc::TensorDev< OutputTensorDataType > TensorDevType
Definition: data_type_distconv_adapter.hpp:60

lbann::base_convolution_layer::m_strides
std::vector< int > m_strides
Definition: base_convolution.hpp:132