TensorComprehensions/api/genetic__tuning__harness_8h_source.html

 #pragma once


 #include <atomic>

 #include <csignal>

 #include <deque>

 #include <memory>

 #include <unordered_map>

 #include <vector>


 #include "tc/aten/aten_compiler.h"

 #include "tc/autotuner/genetic_search.h"

 #include "tc/autotuner/parameters.h"

 #include "tc/autotuner/utils/printer.h"

 #include "tc/lang/parser.h"


 namespace tc {

 namespace autotune {

 namespace detail {


 extern volatile std::sig_atomic_t signal_;

 extern volatile std::sig_atomic_t killRequested_;


 class GeneticTunerHarness {

  public:

   GeneticTunerHarness(

       size_t n,

       uint8_t crossoverRate,

       uint8_t mutationRate,

       size_t numberElites,

       lang::TreeRef tc,

       std::string kernelName,

       const std::unordered_map<size_t, std::vector<const DLTensor*>>& inputs,

       std::unordered_map<size_t, std::vector<DLTensor*>>& outputs,

       MappingOptions baseMapping,

       std::vector<MappingOptions> startingPoints,

       const TuningParameterFixer& fixedParams);

   void run(size_t numGenerations);


  private:

   void setupTuningParameters();


   void runOneGeneration(size_t generation);


   bool warmupOrPrune(

       tc::ExecutionEngine& executionEngine,

       const std::vector<DLTensor*>& outputs,

       const std::vector<const DLTensor*>& inputs,

       size_t handle,

       size_t bestTimeSoFar);


   void doCompile(tc::ExecutionEngine& engine);

   void doGpuWork(size_t gpu, tc::ExecutionEngine& engine, Printer& printer);


   tc::MappingOptions makeOptions(const CandidateConfiguration& conf);

   TuningConfiguration makeTuningConfiguration(const MappingOptions& options);

   MappingOptions bestMappingOption() {

     std::lock_guard<std::mutex> lock(bestTimeMtx_);

     return bestMappingOptions_;

   }


  public:

   static constexpr int kReducedWarmupIterations = 2;

   static constexpr int kReducedBenchmarkIterations = 10;

   static constexpr int kEarlyPruneFactor = 5;


   const size_t kMaxPopulationSize;

   const uint8_t kCrossOverRate;

   const uint8_t kMutationRate;

   const size_t kNumberElites;


   TuningConfiguration configuration;


  private:

   std::mutex bestTimeMtx_;

   size_t bestTime_ = std::numeric_limits<size_t>::max();

   MappingOptions bestMappingOptions_;


   const lang::TreeRef kTc_;

   const std::string kKernelName_;

   std::unique_ptr<GeneticSearch> tuner_;

   std::atomic_size_t currentCompilationJob_;

   std::deque<std::atomic_bool> readyToEvaluate_;

   std::atomic_size_t numEvaluations_;

   const std::unordered_map<size_t, std::vector<const DLTensor*>> kInputs_;

   std::unordered_map<size_t, std::vector<DLTensor*>> outputs_;

   const MappingOptions kBaseMapping_;

   const std::vector<MappingOptions> kStartingPoints_;

 };


 std::vector<size_t> parseGpus();


 } // namespace detail

 } // namespace autotune

 } // namespace tc

tc::autotune::detail::GeneticTunerHarness::kMaxPopulationSize
const size_t kMaxPopulationSize
Definition: genetic_tuning_harness.h:87

tc::autotune::Printer
Definition: printer.h:33

tc::autotune::detail::GeneticTunerHarness::kStartingPoints_
const std::vector< MappingOptions > kStartingPoints_
Definition: genetic_tuning_harness.h:108

tc::ExecutionEngine
Definition: execution_engine.h:34

tc::autotune::detail::GeneticTunerHarness::tuner_
std::unique_ptr< GeneticSearch > tuner_
Definition: genetic_tuning_harness.h:101

tc::autotune::detail::GeneticTunerHarness::kTc_
const lang::TreeRef kTc_
Definition: genetic_tuning_harness.h:99

tc::autotune::TuningConfiguration
Definition: parameters.h:149

tc::autotune::detail::GeneticTunerHarness::warmupOrPrune
bool warmupOrPrune(tc::ExecutionEngine &executionEngine, const std::vector< DLTensor * > &outputs, const std::vector< const DLTensor * > &inputs, size_t handle, size_t bestTimeSoFar)
Helper function to get a kernel into benchmark-able state.

tc::autotune::detail::GeneticTunerHarness::kInputs_
const std::unordered_map< size_t, std::vector< const DLTensor * > > kInputs_
Definition: genetic_tuning_harness.h:105

tc::autotune::detail::GeneticTunerHarness::run
void run(size_t numGenerations)

tc::autotune::detail::GeneticTunerHarness::bestMappingOption
MappingOptions bestMappingOption()
Definition: genetic_tuning_harness.h:77

tc::autotune::detail::GeneticTunerHarness::configuration
TuningConfiguration configuration
Definition: genetic_tuning_harness.h:92

tc::autotune::detail::GeneticTunerHarness::kReducedBenchmarkIterations
static constexpr int kReducedBenchmarkIterations
Definition: genetic_tuning_harness.h:84

tc::autotune::detail::GeneticTunerHarness::bestTimeMtx_
std::mutex bestTimeMtx_
Definition: genetic_tuning_harness.h:95

tc::autotune::detail::GeneticTunerHarness::currentCompilationJob_
std::atomic_size_t currentCompilationJob_
Definition: genetic_tuning_harness.h:102

tc::autotune::detail::GeneticTunerHarness::setupTuningParameters
void setupTuningParameters()

tc::autotune::detail::GeneticTunerHarness::readyToEvaluate_
std::deque< std::atomic_bool > readyToEvaluate_
Definition: genetic_tuning_harness.h:103

parser.h

aten_compiler.h

tc::autotune::detail::GeneticTunerHarness::kMutationRate
const uint8_t kMutationRate
Definition: genetic_tuning_harness.h:89

tc::autotune::detail::GeneticTunerHarness
Definition: genetic_tuning_harness.h:38

tc::autotune::detail::GeneticTunerHarness::bestTime_
size_t bestTime_
Definition: genetic_tuning_harness.h:96

tc::autotune::detail::GeneticTunerHarness::makeTuningConfiguration
TuningConfiguration makeTuningConfiguration(const MappingOptions &options)

tc::MappingOptions
Definition: mapping_options.h:336

genetic_search.h

tc::autotune::detail::GeneticTunerHarness::runOneGeneration
void runOneGeneration(size_t generation)

tc::autotune::detail::killRequested_
volatile std::sig_atomic_t killRequested_

tc::autotune::detail::GeneticTunerHarness::kReducedWarmupIterations
static constexpr int kReducedWarmupIterations
Definition: genetic_tuning_harness.h:83

tc::autotune::detail::GeneticTunerHarness::kKernelName_
const std::string kKernelName_
Definition: genetic_tuning_harness.h:100

tc::autotune::detail::GeneticTunerHarness::kBaseMapping_
const MappingOptions kBaseMapping_
Definition: genetic_tuning_harness.h:107

tc::autotune::detail::GeneticTunerHarness::kNumberElites
const size_t kNumberElites
Definition: genetic_tuning_harness.h:90

tc::autotune::detail::GeneticTunerHarness::doCompile
void doCompile(tc::ExecutionEngine &engine)
Helper function to delegate compiling on the cpu to different threads.

tc::autotune::TuningParameterFixer
Definition: parameters.h:188

tc::autotune::detail::GeneticTunerHarness::doGpuWork
void doGpuWork(size_t gpu, tc::ExecutionEngine &engine, Printer &printer)
Helper function to delegate running on the gpu to different threads.

tc::autotune::detail::GeneticTunerHarness::outputs_
std::unordered_map< size_t, std::vector< DLTensor * > > outputs_
Definition: genetic_tuning_harness.h:106

tc::autotune::detail::GeneticTunerHarness::bestMappingOptions_
MappingOptions bestMappingOptions_
Definition: genetic_tuning_harness.h:97

tc::autotune::detail::GeneticTunerHarness::GeneticTunerHarness
GeneticTunerHarness(size_t n, uint8_t crossoverRate, uint8_t mutationRate, size_t numberElites, lang::TreeRef tc, std::string kernelName, const std::unordered_map< size_t, std::vector< const DLTensor * >> &inputs, std::unordered_map< size_t, std::vector< DLTensor * >> &outputs, MappingOptions baseMapping, std::vector< MappingOptions > startingPoints, const TuningParameterFixer &fixedParams)

parameters.h

tc::autotune::detail::GeneticTunerHarness::numEvaluations_
std::atomic_size_t numEvaluations_
Definition: genetic_tuning_harness.h:104

tc::autotune::detail::GeneticTunerHarness::kCrossOverRate
const uint8_t kCrossOverRate
Definition: genetic_tuning_harness.h:88

printer.h

lang::TreeRef
std::shared_ptr< Tree > TreeRef
Definition: tree.h:44

tc::autotune::CandidateConfiguration
Definition: parameters.h:225

tc::autotune::detail::signal_
volatile std::sig_atomic_t signal_

tc::autotune::detail::GeneticTunerHarness::kEarlyPruneFactor
static constexpr int kEarlyPruneFactor
Definition: genetic_tuning_harness.h:85

tc::autotune::detail::parseGpus
std::vector< size_t > parseGpus()

tc::autotune::detail::GeneticTunerHarness::makeOptions
tc::MappingOptions makeOptions(const CandidateConfiguration &conf)
Make options from conf.