dd/dad/operator__layer__impl_8hpp_source.html

 // Copyright (c) 2014-2023, Lawrence Livermore National Security, LLC.
 // Produced at the Lawrence Livermore National Laboratory.
 // Written by the LBANN Research Team (B. Van Essen, et al.) listed in
 // the CONTRIBUTORS file. <lbann-dev@llnl.gov>
 //
 // LLNL-CODE-697807.
 // All rights reserved.
 //
 // This file is part of LBANN: Livermore Big Artificial Neural Network
 // Toolkit. For details, see http://software.llnl.gov/LBANN or
 // https://github.com/LLNL/LBANN.
 //
 // Licensed under the Apache License, Version 2.0 (the "Licensee"); you
 // may not use this file except in compliance with the License.  You may
 // obtain a copy of the License at:
 //
 // http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or
 // implied. See the License for the specific language governing
 // permissions and limitations under the license.
 #ifndef LBANN_LAYERS_OPERATOR_LAYER_IMPL_HPP_INCLUDED
 #define LBANN_LAYERS_OPERATOR_LAYER_IMPL_HPP_INCLUDED

 #include "lbann/layers/data_type_layer.hpp"
 #include "lbann/layers/operator_layer.hpp"

 #include "lbann/operators/elementwise_operator.hpp"
 #include "lbann/proto/factories.hpp"
 #include "lbann/proto/operator_factory.hpp"
 #include "lbann/utils/exception.hpp"

 #include "lbann/proto/layers.pb.h"
 #include <cereal/types/base_class.hpp>
 #include <memory>

 namespace lbann {

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 OperatorLayer<InputT, OutputT, Layout, D>::OperatorLayer(lbann_comm& comm,
                                                          OperatorPtr op)
   : DataTypeLayer(&comm)
 {
   LBANN_ASSERT(op);
   m_ops.reserve(1);
   m_ops.emplace_back(std::move(op));
   this->m_expected_num_parent_layers = -1; // No limit on parents
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 OperatorLayer<InputT, OutputT, Layout, D>::OperatorLayer(
   lbann_comm& comm,
   std::vector<OperatorPtr> operators)
   : DataTypeLayer(&comm), m_ops{std::move(operators)}
 {
   LBANN_ASSERT(m_ops.size() == 1UL); // For starters.
   LBANN_ASSERT(m_ops[0]);
   this->m_expected_num_parent_layers = -1; // No limit on parents
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 OperatorLayer<InputT, OutputT, Layout, D>::OperatorLayer(
   OperatorLayer const& other)
   : DataTypeLayer(other), m_ops{clone_ops(other.m_ops)}
 {}

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 auto OperatorLayer<InputT, OutputT, Layout, D>::operator=(
   OperatorLayer const& other) -> OperatorLayer&
 {
   // This is self-assignment safe
   data_type_layer<InputT, OutputT>::operator=(other);
   m_ops = clone_ops(other.m_ops);
   return *this;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 auto OperatorLayer<InputT, OutputT, Layout, D>::copy() const -> OperatorLayer*
 {
   return new OperatorLayer<InputT, OutputT, Layout, D>(*this);
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::string OperatorLayer<InputT, OutputT, Layout, D>::get_type() const
 {
   return "operator";
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 data_layout OperatorLayer<InputT, OutputT, Layout, D>::get_data_layout() const
 {
   return Layout;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 El::Device
 OperatorLayer<InputT, OutputT, Layout, D>::get_device_allocation() const
 {
   return D;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 bool OperatorLayer<InputT, OutputT, Layout, D>::can_run_inplace() const
 {
   return true;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 int OperatorLayer<InputT, OutputT, Layout, D>::get_backprop_requirements() const
 {
   // Find the union of all internal operators
   int result = ERROR_SIGNALS;
   for (const auto& op : m_ops) {
     result |= op->get_backprop_requirements();
   }
   return result;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 void OperatorLayer<InputT, OutputT, Layout, D>::fp_compute()
 {
   return m_ops[0]->fp_compute(this->get_inputs(), this->get_outputs());
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 void OperatorLayer<InputT, OutputT, Layout, D>::bp_compute()
 {
   return m_ops[0]->bp_compute(this->get_inputs(),
                               this->get_grad_wrt_outputs(),
                               this->get_grad_wrt_inputs());
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 description OperatorLayer<InputT, OutputT, Layout, D>::get_description() const
 {
   auto desc = DataTypeLayer::get_description();
   for (auto const& op : m_ops)
     desc.add(op->get_description());
   return desc;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 template <typename ArchiveT>
 void OperatorLayer<InputT, OutputT, Layout, D>::serialize(ArchiveT& ar)
 {
   ar(cereal::base_class<DataTypeLayer>(this), m_ops);
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 OperatorLayer<InputT, OutputT, Layout, D>::OperatorLayer()
   : DataTypeLayer(nullptr)
 {
   m_ops.reserve(1);
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 auto OperatorLayer<InputT, OutputT, Layout, D>::clone_ops(
   std::vector<OperatorPtr> const& ops) -> std::vector<OperatorPtr>
 {
   std::vector<OperatorPtr> out;
   out.reserve(ops.size());
   for (auto const& x : ops) {
     out.emplace_back(x->clone());
   }
   return out;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::vector<size_t>
 OperatorLayer<InputT, OutputT, Layout, D>::fix_type(std::vector<int> const& in)
 {
   return std::vector<size_t>{cbegin(in), cend(in)};
 }

 // WARNING: The next 4 functions all assume the minibatch dim is the
 // width of the matrix.

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::vector<utils::ConstDistTensorView<InputT, D>>
 OperatorLayer<InputT, OutputT, Layout, D>::get_inputs() const
 {
   auto n_parents = this->get_num_parents();
   std::vector<utils::ConstDistTensorView<InputT, D>> out;
   out.reserve(n_parents);
   for (int p = 0; p < n_parents; ++p) {
     auto const& prev_acts = this->get_prev_activations(p);
     out.emplace_back(prev_acts,
                      splice_dims(prev_acts.Width(), this->get_input_dims(p)));
   }
   return out;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::vector<utils::DistTensorView<OutputT, D>>
 OperatorLayer<InputT, OutputT, Layout, D>::get_outputs()
 {
   auto n_children = this->get_num_children();
   std::vector<utils::DistTensorView<OutputT, D>> out;
   out.reserve(n_children);
   for (int c = 0; c < n_children; ++c) {
     auto& acts = this->get_activations(c);
     out.emplace_back(acts, splice_dims(acts.Width(), this->get_output_dims(c)));
   }
   return out;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::vector<utils::ConstDistTensorView<OutputT, D>>
 OperatorLayer<InputT, OutputT, Layout, D>::get_grad_wrt_outputs() const
 {
   auto n_children = this->get_num_children();
   std::vector<utils::ConstDistTensorView<OutputT, D>> out;
   out.reserve(n_children);
   for (int c = 0; c < n_children; ++c) {
     auto const& prev_sigs = this->get_prev_error_signals(c);
     out.emplace_back(prev_sigs,
                      splice_dims(prev_sigs.Width(), this->get_output_dims(c)));
   }
   return out;
 }

 template <typename InputT, typename OutputT, data_layout Layout, El::Device D>
 std::vector<utils::DistTensorView<InputT, D>>
 OperatorLayer<InputT, OutputT, Layout, D>::get_grad_wrt_inputs()
 {
   auto n_parents = this->get_num_parents();
   std::vector<utils::DistTensorView<InputT, D>> out;
   out.reserve(n_parents);
   for (int p = 0; p < n_parents; ++p) {
     auto& error_sigs = this->get_error_signals(p);
     out.emplace_back(error_sigs,
                      splice_dims(error_sigs.Width(), this->get_input_dims(p)));
   }
   return out;
 }

 } // namespace lbann

 template <typename InputT,
           typename OutputT,
           lbann::data_layout Layout,
           El::Device D>
 auto lbann::build_operator_layer_from_pbuf(lbann_comm* comm,
                                            lbann_data::Layer const& msg)
   -> std::unique_ptr<Layer>
 {
   using LayerType = OperatorLayer<InputT, OutputT, Layout, D>;
   using OperatorType = Operator<InputT, OutputT, D>;
   using OperatorPtr = std::unique_ptr<OperatorType>;

   LBANN_ASSERT(comm); // Sanity check

   // Build up the list of operators for this layer.
   auto const& params = msg.operator_layer();

   auto const num_ops = params.ops_size();
   std::vector<OperatorPtr> ops;
   ops.reserve(num_ops);
   for (int ii = 0; ii < num_ops; ++ii) {
 #ifdef LBANN_DEBUG
     LBANN_ASSERT(msg.datatype() == params.ops(ii).input_datatype());
     LBANN_ASSERT(msg.datatype() == params.ops(ii).output_datatype());
 #endif
     ops.emplace_back(
       proto::construct_operator<InputT, OutputT, D>(params.ops(ii)));
   }
   return std::make_unique<LayerType>(*comm, std::move(ops));
 }

 #ifndef LBANN_INSTANTIATE_OPERATOR_LAYER
 namespace lbann {

 #define PROTO_DEVICE(T, D)                                                     \
   extern template class OperatorLayer<T, T, data_layout::DATA_PARALLEL, D>;    \
   extern template class OperatorLayer<T, T, data_layout::MODEL_PARALLEL, D>;   \
   extern template std::unique_ptr<Layer>                                       \
   build_operator_layer_from_pbuf<T, T, data_layout::DATA_PARALLEL, D>(         \
     lbann_comm*,                                                               \
     lbann_data::Layer const&);                                                 \
   extern template std::unique_ptr<Layer>                                       \
   build_operator_layer_from_pbuf<T, T, data_layout::MODEL_PARALLEL, D>(        \
     lbann_comm*,                                                               \
     lbann_data::Layer const&)

 #include "lbann/macros/instantiate_device.hpp"

 } // namespace lbann
 #endif // LBANN_INSTANTIATE_OPERATOR_LAYER
 #endif // LBANN_LAYERS_OPERATOR_LAYER_IMPL_HPP_INCLUDED
lbann::ERROR_SIGNALS
Definition: base.hpp:207

lbann::OperatorLayer::OperatorLayer
OperatorLayer()
Definition: operator_layer_impl.hpp:154

lbann::splice_dims
std::vector< size_t > splice_dims(ArgTs &&... args)
Definition: dim_helpers.hpp:142

lbann::OperatorLayer::get_type
std::string get_type() const final
Get the layer type&#39;s name.
Definition: operator_layer_impl.hpp:88

lbann::OperatorLayer::get_grad_wrt_outputs
std::vector< utils::ConstDistTensorView< OutputT, D > > get_grad_wrt_outputs() const
Definition: operator_layer_impl.hpp:213

lbann::OperatorLayer::m_ops
std::vector< OperatorPtr > m_ops
Definition: operator_layer.hpp:53

lbann::OperatorLayer::fix_type
static std::vector< size_t > fix_type(std::vector< int > const &in)
Definition: operator_layer_impl.hpp:174

lbann::OperatorLayer::get_device_allocation
El::Device get_device_allocation() const final
Get the device allocation for the data tensors. We assume that the decice allocation of the previous ...
Definition: operator_layer_impl.hpp:101

lbann::Layer::get_num_parents
int get_num_parents() const noexcept
Get number of parent layers.
Definition: layer.hpp:574

lbann::OperatorLayer::operator=
OperatorLayer & operator=(OperatorLayer const &other)
Copy assignment.
Definition: operator_layer_impl.hpp:72

lbann::OperatorLayer::get_description
description get_description() const final
Human-readable description.
Definition: operator_layer_impl.hpp:138

lbann::lbann_comm
Definition: comm.hpp:105

lbann::Layer::get_input_dims
std::vector< int > get_input_dims(size_t input_index=0) const
Get input tensor dimensions.

lbann::description
Generates nicely formatted description messages.
Definition: description.hpp:49

lbann::Layer::get_description
virtual description get_description() const
Human-readable description.

lbann::Device
constexpr El::Device Device
Definition: OperatorTraits.hpp:62

lbann::data_type_layer< InputT, OutputT >::get_prev_error_signals
OutputAbsDistMatrixType & get_prev_error_signals(int child_index=0)

lbann::data_type_layer< InputT, OutputT >::get_prev_activations
InputAbsDistMatrixType & get_prev_activations(int parent_index=0)

LBANN_ASSERT
#define LBANN_ASSERT(cond)
Definition: exception.hpp:97

lbann::data_type_layer< InputT, OutputT >::get_activations
const OutputAbsDistMatrixType & get_activations(const Layer &child) const override

lbann::build_operator_layer_from_pbuf
std::unique_ptr< Layer > build_operator_layer_from_pbuf(lbann_comm *, lbann_data::Layer const &)

lbann::OperatorLayer::get_inputs
std::vector< utils::ConstDistTensorView< InputT, D > > get_inputs() const
Definition: operator_layer_impl.hpp:184

lbann::OperatorLayer::serialize
void serialize(ArchiveT &)
Definition: operator_layer_impl.hpp:148

lbann::Layer::get_num_children
int get_num_children() const noexcept
Get number of child layers.
Definition: layer.hpp:576

lbann::OperatorLayer::bp_compute
void bp_compute() final
Compute objective funciton gradients. Called by the &#39;back_prop&#39; function. Given the input...
Definition: operator_layer_impl.hpp:130

lbann::data_type_layer< InputT, OutputT >

lbann::OperatorLayer::clone_ops
static std::vector< OperatorPtr > clone_ops(std::vector< OperatorPtr > const &ops)
Definition: operator_layer_impl.hpp:161

lbann::OperatorLayer::copy
OperatorLayer * copy() const final
Polymorphic copy.
Definition: operator_layer_impl.hpp:82

lbann::OperatorLayer::get_backprop_requirements
int get_backprop_requirements() const final
Returns the necessary tensors for computing backpropagation.
Definition: operator_layer_impl.hpp:113

operator_factory.hpp

elementwise_operator.hpp

exception.hpp

instantiate_device.hpp

lbann::data_layout
data_layout
Data layout that is optimized for different modes of parallelism.
Definition: base.hpp:218

lbann::OperatorLayer::fp_compute
void fp_compute() final
Apply layer operation. Called by the &#39;forward_prop&#39; function. Given the input tensors, the output tensors are populated with computed values.
Definition: operator_layer_impl.hpp:124

data_type_layer.hpp

factories.hpp

lbann::OperatorLayer::get_data_layout
data_layout get_data_layout() const final
Get data layout of the data tensors. We assume that the data layouts of the previous activations...
Definition: operator_layer_impl.hpp:94

lbann::Operator
Neural network tensor operation.
Definition: operator.hpp:85

lbann::OperatorLayer::get_outputs
std::vector< utils::DistTensorView< OutputT, D > > get_outputs()
Definition: operator_layer_impl.hpp:199

lbann::OperatorLayer::can_run_inplace
bool can_run_inplace() const final
If True, the computation can run in-place (feeding each input activations tensor as the corresponding...
Definition: operator_layer_impl.hpp:107

lbann::OperatorLayer::OperatorPtr
std::unique_ptr< OperatorType > OperatorPtr
Definition: operator_layer.hpp:51

lbann::Layer::get_output_dims
std::vector< int > get_output_dims(size_t output_index=0) const
Get output tensor dimensions.

lbann::OperatorLayer
Layer composed of one or more operator objects.
Definition: operator_layer.hpp:47

operator_layer.hpp

lbann::OperatorLayer::get_grad_wrt_inputs
std::vector< utils::DistTensorView< InputT, D > > get_grad_wrt_inputs()
Definition: operator_layer_impl.hpp:228

lbann::Layer::m_expected_num_parent_layers
int m_expected_num_parent_layers
Definition: layer.hpp:838

lbann::data_type_layer::operator=
data_type_layer & operator=(data_type_layer &&other)=default

lbann::data_type_layer< InputT, OutputT >::get_error_signals
const InputAbsDistMatrixType & get_error_signals(const Layer &parent) const override

lbann
Definition: callback_helpers.hpp:32