tests/counter/benchmark.lua

*8d741a5dSApple OSS Distributions#!/usr/local/bin/recon
*8d741a5dSApple OSS Distributionsrequire 'strict'
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionslocal benchrun = require 'benchrun'
*8d741a5dSApple OSS Distributionslocal perfdata = require 'perfdata'
*8d741a5dSApple OSS Distributionslocal sysctl = require 'sysctl'
*8d741a5dSApple OSS Distributionslocal csv = require 'csv'
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionslocal kDefaultNumWrites = 10000000000
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionslocal benchmark = benchrun.new {
*8d741a5dSApple OSS Distributions    name = 'xnu.per_cpu_counter',
*8d741a5dSApple OSS Distributions    version = 1,
*8d741a5dSApple OSS Distributions    arg = arg,
*8d741a5dSApple OSS Distributions    modify_argparser = function(parser)
*8d741a5dSApple OSS Distributions        parser:argument{
*8d741a5dSApple OSS Distributions          name = 'path',
*8d741a5dSApple OSS Distributions          description = 'Path to benchmark binary'
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions        parser:option{
*8d741a5dSApple OSS Distributions            name = '--cpu-workers',
*8d741a5dSApple OSS Distributions            description = 'Number of cpu workers'
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions        parser:flag{
*8d741a5dSApple OSS Distributions          name = '--through-max-workers',
*8d741a5dSApple OSS Distributions          description = 'Run benchmark for [1..n] cpu workers'
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions        parser:flag{
*8d741a5dSApple OSS Distributions          name = '--through-max-workers-fast',
*8d741a5dSApple OSS Distributions          description = 'Run benchmark for [1..2] and each power of four value in [4..n] cpu workers'
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions        parser:option {
*8d741a5dSApple OSS Distributions            name = "--num-writes",
*8d741a5dSApple OSS Distributions            description = "number of writes",
*8d741a5dSApple OSS Distributions            default = kDefaultNumWrites
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions        parser:option{
*8d741a5dSApple OSS Distributions            name = '--variant',
*8d741a5dSApple OSS Distributions            description = 'Which benchmark variant to run (scalable, atomic, or racy)',
*8d741a5dSApple OSS Distributions            default = 'scalable',
*8d741a5dSApple OSS Distributions            choices = {"scalable", "atomic", "racy"}
*8d741a5dSApple OSS Distributions        }
*8d741a5dSApple OSS Distributions    end
*8d741a5dSApple OSS Distributions}
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionsassert(benchmark.opt.path, "No path supplied for fault throughput binary")
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionslocal ncpus, err = sysctl('hw.logicalcpu_max')
*8d741a5dSApple OSS Distributionsassert(ncpus > 0, 'invalid number of logical cpus')
*8d741a5dSApple OSS Distributionslocal cpu_workers = tonumber(benchmark.opt.cpu_workers) or ncpus
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionslocal writes_per_second = perfdata.unit.custom('writes/sec')
*8d741a5dSApple OSS Distributionslocal tests = {}
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionsfunction QueueTest(num_cores)
*8d741a5dSApple OSS Distributions    table.insert(tests, {
*8d741a5dSApple OSS Distributions        path = benchmark.opt.path,
*8d741a5dSApple OSS Distributions        num_cores = num_cores,
*8d741a5dSApple OSS Distributions    })
*8d741a5dSApple OSS Distributionsend
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionsif benchmark.opt.through_max_workers then
*8d741a5dSApple OSS Distributions    for i = 1, cpu_workers do
*8d741a5dSApple OSS Distributions        QueueTest(i)
*8d741a5dSApple OSS Distributions    end
*8d741a5dSApple OSS Distributionselseif benchmark.opt.through_max_workers_fast then
*8d741a5dSApple OSS Distributions    local i = 1
*8d741a5dSApple OSS Distributions    while i <= cpu_workers do
*8d741a5dSApple OSS Distributions        QueueTest(i)
*8d741a5dSApple OSS Distributions        -- Always do a run with two threads to see what the first part of
*8d741a5dSApple OSS Distributions        -- the scaling curve looks like
*8d741a5dSApple OSS Distributions        -- (and to measure perf on dual core systems).
*8d741a5dSApple OSS Distributions        if i == 1 and cpu_workers >= 2 then
*8d741a5dSApple OSS Distributions            QueueTest(i + 1)
*8d741a5dSApple OSS Distributions        end
*8d741a5dSApple OSS Distributions        i = i * 4
*8d741a5dSApple OSS Distributions    end
*8d741a5dSApple OSS Distributionselse
*8d741a5dSApple OSS Distributions    QueueTest(cpu_workers)
*8d741a5dSApple OSS Distributionsend
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionsfor _, test in ipairs(tests) do
*8d741a5dSApple OSS Distributions    local args = {test.path, benchmark.opt.variant, benchmark.opt.num_writes, test.num_cores,
*8d741a5dSApple OSS Distributions                     echo = true}
*8d741a5dSApple OSS Distributions    for out in benchmark:run(args) do
*8d741a5dSApple OSS Distributions        local result = out:match("-----Results-----\n(.*)")
*8d741a5dSApple OSS Distributions        benchmark:assert(result, "Unable to find result data in output")
*8d741a5dSApple OSS Distributions        local data = csv.openstring(result, {header = true})
*8d741a5dSApple OSS Distributions        for field in data:lines() do
*8d741a5dSApple OSS Distributions            for k, v in pairs(field) do
*8d741a5dSApple OSS Distributions                local unit = writes_per_second
*8d741a5dSApple OSS Distributions                local larger_better = true
*8d741a5dSApple OSS Distributions                if k == "loss" then
*8d741a5dSApple OSS Distributions                    unit = percentage
*8d741a5dSApple OSS Distributions                    larger_better = false
*8d741a5dSApple OSS Distributions                end
*8d741a5dSApple OSS Distributions                benchmark.writer:add_value(k, unit, tonumber(v), {
*8d741a5dSApple OSS Distributions                  [perfdata.larger_better] = larger_better,
*8d741a5dSApple OSS Distributions                  threads = test.num_cores,
*8d741a5dSApple OSS Distributions                  variant = benchmark.opt.variant
*8d741a5dSApple OSS Distributions                })
*8d741a5dSApple OSS Distributions            end
*8d741a5dSApple OSS Distributions        end
*8d741a5dSApple OSS Distributions    end
*8d741a5dSApple OSS Distributionsend
*8d741a5dSApple OSS Distributions
*8d741a5dSApple OSS Distributionsbenchmark:finish()