da/d51/slice_8hpp_source.html

 // Copyright (c) 2014-2023, Lawrence Livermore National Security, LLC.
 // Produced at the Lawrence Livermore National Laboratory.
 // Written by the LBANN Research Team (B. Van Essen, et al.) listed in
 // the CONTRIBUTORS file. <lbann-dev@llnl.gov>
 //
 // LLNL-CODE-697807.
 // All rights reserved.
 //
 // This file is part of LBANN: Livermore Big Artificial Neural Network
 // Toolkit. For details, see http://software.llnl.gov/LBANN or
 // https://github.com/LLNL/LBANN.
 //
 // Licensed under the Apache License, Version 2.0 (the "Licensee"); you
 // may not use this file except in compliance with the License.  You may
 // obtain a copy of the License at:
 //
 // http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or
 // implied. See the License for the specific language governing
 // permissions and limitations under the license.

 #ifndef LBANN_LAYERS_TRANSFORM_SLICE_HPP_INCLUDED
 #define LBANN_LAYERS_TRANSFORM_SLICE_HPP_INCLUDED

 #include "lbann/layers/data_type_layer.hpp"
 #include "lbann/layers/layer.hpp"
 #include "lbann/models/model.hpp"
 #include "lbann/proto/datatype_helpers.hpp"
 #include "lbann/proto/layers.pb.h"
 #include "lbann/trainers/trainer.hpp"
 #include "lbann/utils/exception.hpp"
 #include "lbann/utils/protobuf.hpp"

 namespace lbann {

 template <typename TensorDataType,
           data_layout Layout = data_layout::DATA_PARALLEL,
           El::Device Device = El::Device::CPU>
 class slice_layer : public data_type_layer<TensorDataType>
 {
 public:
   slice_layer(lbann_comm* comm);
   slice_layer(const slice_layer& other) = default;
   slice_layer& operator=(const slice_layer& other) = default;

   slice_layer* copy() const override;


   template <typename ArchiveT>
   void serialize(ArchiveT& ar);


   std::string get_type() const override;
   data_layout get_data_layout() const override;
   El::Device get_device_allocation() const override;
   bool can_run_inplace() const override { return false; }
   int get_backprop_requirements() const override { return ERROR_SIGNALS; }

   description get_description() const override;

   void setup_slice_points(size_t slice_dim, std::vector<size_t> slice_points)
   {
     m_slice_dim = slice_dim;
     m_slice_points = std::move(slice_points);
   }

   void setup_slice_points(size_t slice_dim,
                           bool set_slice_points_from_data_reader,
                           const slice_points_mode var_category)
   {
     m_slice_dim = slice_dim;
     m_set_slice_points_from_data_reader = set_slice_points_from_data_reader;
     m_var_category = var_category;
   }

 protected:
   void write_specific_proto(lbann_data::Layer& proto) const final;

   El::SyncInfo<Device> syncSubGridCommunication = El::SyncInfo<Device>();

   friend class cereal::access;
   slice_layer() : slice_layer(nullptr) {}

   void setup_dims() override;

   void fp_setup_outputs() override;
   void bp_setup_gradient_wrt_inputs() override;
   void fp_compute() override;
   void bp_compute() override;
   void fp_compute_subgrid();
   void bp_compute_subgrid();

 private:
   size_t m_slice_dim;
   std::vector<size_t> m_slice_points;
   bool m_set_slice_points_from_data_reader;
   slice_points_mode m_var_category;

 #ifdef LBANN_HAS_GPU

   std::shared_ptr<hydrogen::simple_buffer<unsigned char, El::Device::CPU>>
     m_workspace;
   gpu_lib::event_wrapper m_workspace_event;
 #endif // LBANN_HAS_GPU

   template <typename U, El::Device D>
   friend void fp_setup_outputs_impl(slice_layer<U, Layout, D>&);
   template <typename U>
   friend void fp_compute_impl(slice_layer<U, Layout, Device>&);
   template <typename U>
   friend void bp_compute_impl(slice_layer<U, Layout, Device>&);
 };

 // =========================================================
 // Implementation
 // =========================================================

 template <typename T, data_layout L, El::Device D>
 void slice_layer<T, L, D>::write_specific_proto(lbann_data::Layer& proto) const
 {
   proto.set_datatype(proto::ProtoDataType<T>);
   auto* msg = proto.mutable_slice();
   msg->set_axis(m_slice_dim);
   protobuf::assign_to_repeated(*msg->mutable_slice_points(), m_slice_points);
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 slice_layer<TensorDataType, Layout, Device>::slice_layer(lbann_comm* comm)
   : data_type_layer<TensorDataType>(comm),
     m_set_slice_points_from_data_reader(false),
     m_var_category(slice_points_mode::NA)
 #ifdef LBANN_HAS_GPU
     ,
     m_workspace{
       std::make_shared<hydrogen::simple_buffer<unsigned char, El::Device::CPU>>(
         0UL,
         hydrogen::SyncInfo<El::Device::CPU>{},
         1U /*=pinned*/)}
 #endif /* LBANN_HAS_GPU */
 {
   this->m_expected_num_child_layers = -1; // No limit on children
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 slice_layer<TensorDataType, Layout, Device>*
 slice_layer<TensorDataType, Layout, Device>::copy() const
 {
   return new slice_layer(*this);
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 std::string slice_layer<TensorDataType, Layout, Device>::get_type() const
 {
   return "slice";
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 data_layout slice_layer<TensorDataType, Layout, Device>::get_data_layout() const
 {
   return Layout;
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 El::Device
 slice_layer<TensorDataType, Layout, Device>::get_device_allocation() const
 {
   return Device;
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 description slice_layer<TensorDataType, Layout, Device>::get_description() const
 {
   auto desc = data_type_layer<TensorDataType>::get_description();
   desc.add("Slice dimension", m_slice_dim);
   std::ostringstream ss;
   for (size_t i = 0; i < m_slice_points.size(); ++i) {
     ss << (i > 0 ? ", " : "") << m_slice_points[i];
   }
   desc.add("Slice points", ss.str());
   return desc;
 }

 template <typename TensorDataType, El::Device Device>
 void fp_setup_outputs_impl(
   slice_layer<TensorDataType, data_layout::MODEL_PARALLEL, Device>& l)
 {

   // Slice Elemental matrices
   // Note: Assume each mini-batch sample is flat.
   const size_t num_outputs = l.get_num_children();
   const auto& input = l.get_prev_activations();
   size_t offset = l.m_slice_points.front();
   for (size_t j = 0; j < num_outputs; ++j) {
     auto& output = l.get_activations(j);
     const auto& output_size = l.get_output_size(j);
     El::LockedView(output,
                    input,
                    El::IR(offset, offset + output_size),
                    El::ALL);
     offset += output_size;
   }
 }

 template <typename TensorDataType, El::Device Device>
 void fp_setup_outputs_impl(
   slice_layer<TensorDataType, data_layout::DATA_PARALLEL, Device>& l)
 {

   const size_t num_outputs = l.get_num_children();
   const auto& input = l.get_prev_activations();
   for (size_t j = 0; j < num_outputs; ++j) {
     auto& output = l.get_activations(j);
     // output.AlignWith(input);
     output.Resize(l.get_output_size(j), input.Width());
   }
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::fp_setup_outputs()
 {
   fp_setup_outputs_impl(*this);
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::fp_compute_subgrid()
 {
   const auto& input_dims = this->get_input_dims();
   const size_t num_dims = input_dims.size();
   if (num_dims > 3) {
     LBANN_ERROR(this->get_type(),
                 " layer \"",
                 this->get_name(),
                 "\" ",
                 "is operating on ",
                 num_dims,
                 "-D tensors, ",
                 "but only 3-D tensors are currently supported");
   }

   const int split_dim = input_dims[this->m_slice_dim];

   if (this->m_slice_dim != num_dims - 1) {
     LBANN_ERROR(this->get_type(),
                 " layer \"",
                 this->get_name(),
                 "\" ",
                 "has axis ",
                 this->m_slice_dim,
                 " However, ",
                 "Subgrpah parallelism is supported when split axis is the last "
                 "dimension");
   }
   const auto& input = this->get_prev_activations();

   auto const* ptr_input = dynamic_cast<
     El::
       DistMatrix<TensorDataType, El::STAR, El::VC, El::ELEMENT, Device> const*>(
     &input);

   if (this->get_communication_flag() == COLL_OPT) {
     El::copy::TranslateBetweenGridsScatter<TensorDataType, Device, Device>(
       *ptr_input,
       this->get_all_activations(),
       split_dim,
       this->get_subgrid_comm(),
       syncSubGridCommunication,
       3);
   }
   else if (this->get_communication_flag() == COLL) {
     El::copy::TranslateBetweenGridsScatter<TensorDataType, Device, Device>(
       *ptr_input,
       this->get_all_activations(),
       split_dim,
       this->get_subgrid_comm(),
       syncSubGridCommunication,
       2);
   }
   else {
     El::copy::TranslateBetweenGridsScatter<TensorDataType, Device, Device>(
       *ptr_input,
       this->get_all_activations(),
       split_dim,
       this->get_subgrid_comm(),
       syncSubGridCommunication,
       1);
   }
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::fp_compute()
 {
   const auto& input_dims = this->get_input_dims();
   const size_t num_dims = input_dims.size();

   if (this->m_slice_dim == num_dims - 1 &&
       this->subgraph_parallelism_execution()) {
     fp_compute_subgrid();
   }
   else {
     fp_compute_impl(*this);
   }
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::bp_compute_subgrid()
 {
   const auto& input_dims = this->get_input_dims();

   const int split_dim =
     int(input_dims[this->m_slice_dim] / this->get_num_children());

   auto& input_grad = this->get_error_signals();

   auto* ptr_input_grad = dynamic_cast<
     El::DistMatrix<TensorDataType, El::STAR, El::VC, El::ELEMENT, Device>*>(
     &input_grad);

   El::copy::TranslateBetweenGridsGather<TensorDataType, Device, Device>(
     *ptr_input_grad,
     this->get_all_prev_error_signals(),
     split_dim,
     this->get_subgrid_comm(),
     syncSubGridCommunication);
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::bp_setup_gradient_wrt_inputs()
 {
   const auto& output0_grad = this->get_prev_error_signals(0);
   auto& input_grad = this->get_error_signals();
   input_grad.Empty(false);
   input_grad.Resize(this->get_input_size(), output0_grad.Width());
   El::Zeros(input_grad, this->get_input_size(), output0_grad.Width());
 }

 template <typename TensorDataType, data_layout Layout, El::Device Device>
 void slice_layer<TensorDataType, Layout, Device>::bp_compute()
 {

   const auto& input_dims = this->get_input_dims();
   const size_t num_dims = input_dims.size();

   if (this->m_slice_dim == num_dims - 1 &&
       this->subgraph_parallelism_execution()) {
     bp_compute_subgrid();
   }
   else {
     bp_compute_impl(*this);
   }
 }

 #ifndef LBANN_SLICE_LAYER_INSTANTIATE
 #define PROTO_DEVICE(T, Device)                                                \
   extern template class slice_layer<T, data_layout::DATA_PARALLEL, Device>;    \
   extern template class slice_layer<T, data_layout::MODEL_PARALLEL, Device>

 #include "lbann/macros/instantiate_device.hpp"
 #undef PROTO_DEVICE
 #endif // LBANN_SLICE_LAYER_INSTANTIATE

 } // namespace lbann

 #endif // LBANN_LAYERS_TRANSFORM_SLICE_HPP_INCLUDED
lbann::ERROR_SIGNALS
Definition: base.hpp:207

lbann::slice_layer::serialize
void serialize(ArchiveT &ar)

lbann::slice_layer::syncSubGridCommunication
El::SyncInfo< Device > syncSubGridCommunication
Definition: slice.hpp:93

lbann::slice_layer::m_set_slice_points_from_data_reader
bool m_set_slice_points_from_data_reader
Definition: slice.hpp:113

lbann::slice_layer::setup_dims
void setup_dims() override
Setup tensor dimensions Called by the &#39;setup&#39; function. If there are any input tensors, the base method sets all uninitialized output tensor dimensions equal to the first input tensor dimensions.
Definition: slice_impl.hpp:36

lbann::slice_points_mode
slice_points_mode
Definition: metadata.hpp:66

trainer.hpp

LBANN_ERROR
#define LBANN_ERROR(...)
Definition: exception.hpp:37

lbann::Layer::get_output_size
int get_output_size(size_t output_index=0) const
Get output tensor size.

lbann::lbann_comm
Definition: comm.hpp:105

lbann::Layer::get_input_dims
std::vector< int > get_input_dims(size_t input_index=0) const
Get input tensor dimensions.

lbann::description
Generates nicely formatted description messages.
Definition: description.hpp:49

lbann::slice_layer::setup_slice_points
void setup_slice_points(size_t slice_dim, bool set_slice_points_from_data_reader, const slice_points_mode var_category)
Definition: slice.hpp:80

lbann::slice_layer::bp_compute
void bp_compute() override
Compute objective funciton gradients. Called by the &#39;back_prop&#39; function. Given the input...
Definition: slice.hpp:364

lbann::slice_layer::get_device_allocation
El::Device get_device_allocation() const override
Get the device allocation for the data tensors. We assume that the decice allocation of the previous ...
Definition: slice.hpp:192

lbann::Layer::get_description
virtual description get_description() const
Human-readable description.

lbann::slice_layer::get_backprop_requirements
int get_backprop_requirements() const override
Returns the necessary tensors for computing backpropagation.
Definition: slice.hpp:70

lbann::Device
constexpr El::Device Device
Definition: OperatorTraits.hpp:62

lbann::data_type_layer< TensorDataType >::get_prev_error_signals
OutputAbsDistMatrixType & get_prev_error_signals(int child_index=0)

lbann::data_type_layer< TensorDataType >::get_prev_activations
InputAbsDistMatrixType & get_prev_activations(int parent_index=0)

lbann::slice_layer
Slice tensor along a specified dimension.
Definition: slice.hpp:49

lbann::data_type_layer< TensorDataType >::get_activations
const OutputAbsDistMatrixType & get_activations(const Layer &child) const override

lbann::Layer::m_expected_num_child_layers
int m_expected_num_child_layers
Expected number of child layers. A negative value indicates no limit.
Definition: layer.hpp:842

lbann::Layer::get_input_size
int get_input_size(size_t input_index=0) const
Get input tensor size.

lbann::protobuf::assign_to_repeated
void assign_to_repeated(google::protobuf::RepeatedField< T > &field, ContainerT const &values)
Assign a range of values to a repeated protobuf field.
Definition: impl.hpp:125

lbann::slice_layer::bp_compute_subgrid
void bp_compute_subgrid()
Definition: slice.hpp:332

lbann::slice_layer::m_var_category
slice_points_mode m_var_category
Definition: slice.hpp:115

lbann::data_type_layer< TensorDataType >::get_all_activations
std::vector< std::unique_ptr< OutputAbsDistMatrixType > > & get_all_activations()

lbann::slice_layer::slice_layer
slice_layer()
Definition: slice.hpp:96

lbann::slice_layer::m_slice_points
std::vector< size_t > m_slice_points
Definition: slice.hpp:111

lbann::Layer::get_num_children
int get_num_children() const noexcept
Get number of child layers.
Definition: layer.hpp:576

lbann::slice_layer::operator=
slice_layer & operator=(const slice_layer &other)=default

lbann::slice_layer::can_run_inplace
bool can_run_inplace() const override
If True, the computation can run in-place (feeding each input activations tensor as the corresponding...
Definition: slice.hpp:69

lbann::slice_layer::m_slice_dim
size_t m_slice_dim
Definition: slice.hpp:109

lbann::slice_layer::write_specific_proto
void write_specific_proto(lbann_data::Layer &proto) const final
Definition: slice.hpp:146

lbann::data_type_layer
Definition: data_type_layer.hpp:69

lbann::slice_layer::get_type
std::string get_type() const override
Get the layer type&#39;s name.
Definition: slice.hpp:179

lbann::slice_layer::setup_slice_points
void setup_slice_points(size_t slice_dim, std::vector< size_t > slice_points)
Definition: slice.hpp:74

layer.hpp

lbann::data_layout::DATA_PARALLEL

lbann::Layer::get_name
std::string get_name() const
Get the layer instance&#39;s name.
Definition: layer.hpp:332

lbann::slice_layer::copy
slice_layer * copy() const override
Copy function. This function dynamically allocates memory for a layer instance and instantiates a cop...
Definition: slice.hpp:173

lbann::slice_layer::fp_compute
void fp_compute() override
Apply layer operation. Called by the &#39;forward_prop&#39; function. Given the input tensors, the output tensors are populated with computed values.
Definition: slice.hpp:317

exception.hpp

instantiate_device.hpp

lbann::slice_layer::fp_compute_subgrid
void fp_compute_subgrid()
Definition: slice.hpp:252

lbann::slice_layer::fp_setup_outputs_impl
friend void fp_setup_outputs_impl(slice_layer< U, Layout, D > &)

lbann::data_layout
data_layout
Data layout that is optimized for different modes of parallelism.
Definition: base.hpp:218

lbann::slice_layer::bp_setup_gradient_wrt_inputs
void bp_setup_gradient_wrt_inputs() override
Setup gradient w.r.t. input tensors. Called by the &#39;back_prop&#39; function. Each gradient w...
Definition: slice.hpp:354

data_type_layer.hpp

lbann::slice_layer::access
friend class cereal::access
Definition: slice.hpp:95

lbann::Layer::get_communication_flag
SubGraphCommunication get_communication_flag()
Definition: layer.hpp:487

lbann::data_type_layer< TensorDataType >::get_subgrid_comm
El::mpi::Comm & get_subgrid_comm()
Definition: data_type_layer.hpp:182

lbann::slice_layer::fp_compute_impl
friend void fp_compute_impl(slice_layer< U, Layout, Device > &)

lbann::slice_layer::get_description
description get_description() const override
Human-readable description.
Definition: slice.hpp:198

lbann::data_reader_target_mode::NA

lbann::COLL_OPT
Definition: layer.hpp:265

lbann::Layer::subgraph_parallelism_execution
bool subgraph_parallelism_execution() const noexcept
Definition: layer.hpp:522

lbann::slice_layer::fp_setup_outputs
void fp_setup_outputs() override
Setup output tensors. Called by the &#39;forward_prop&#39; function. Each output tensor is resized to match t...
Definition: slice.hpp:246

lbann::slice_layer::get_data_layout
data_layout get_data_layout() const override
Get data layout of the data tensors. We assume that the data layouts of the previous activations...
Definition: slice.hpp:185

lbann::data_type_layer< TensorDataType >::get_all_prev_error_signals
std::vector< std::unique_ptr< OutputAbsDistMatrixType > > & get_all_prev_error_signals()

model.hpp

lbann::data_type_layer< TensorDataType >::get_error_signals
const InputAbsDistMatrixType & get_error_signals(const Layer &parent) const override

lbann::COLL
Definition: layer.hpp:264

lbann
Definition: callback_helpers.hpp:32

lbann::slice_layer::bp_compute_impl
friend void bp_compute_impl(slice_layer< U, Layout, Device > &)

protobuf.hpp

datatype_helpers.hpp