Changes in / [7b1f6d4:276a94d7]


Ignore:
Files:
3 deleted
5 edited

Legend:

Unmodified
Added
Removed
  • benchmark/Makefile.am

    r7b1f6d4 r276a94d7  
    522522size-cfa$(EXEEXT):
    523523        $(BENCH_V_CFA)$(CFACOMPILE) $(srcdir)/size/size.cfa
    524 
    525 ## =========================================================================================================
    526 
    527 %-tokio$(EXEEXT): $(srcdir)/readyQ/%.rs $(srcdir)/bench.rs
    528         cd $(builddir) && cargo build --release
    529         cp $(builddir)/target/release/$(basename $@) $@
  • benchmark/readyQ/bench.go

    r7b1f6d4 r276a94d7  
    55        "flag"
    66        "fmt"
    7         "log"
    87        "os"
    98        "runtime"
    10         "runtime/pprof"
    119        "sync/atomic"
    1210        "time"
     
    4543}
    4644
    47 func bench_init() func() {
     45func bench_init() {
    4846        nprocsOpt := flag.Int("p", 1, "The number of processors")
    4947        nthreadsOpt := flag.Int("t", 1, "The number of threads")
    5048        durationOpt := flag.Float64("d", 0, "Duration of the experiment in seconds")
    5149        stopOpt := flag.Uint64("i", 0, "Duration of the experiment in iterations")
    52         cpuprofile := flag.String("cpuprofile", "", "write cpu profile to file")
    5350
    5451        flag.Parse()
     
    7572
    7673        runtime.GOMAXPROCS(nprocs)
    77 
    78         if (*cpuprofile) != "" {
    79                 f, err := os.Create(*cpuprofile)
    80                 if err != nil {
    81                     log.Fatal(err)
    82                 }
    83                 pprof.StartCPUProfile(f)
    84         }
    85 
    86         return func() {
    87                 if (*cpuprofile) != "" {
    88                         pprof.StopCPUProfile()
    89                 }
    90         }
    9174}
  • benchmark/readyQ/cycle.rs

    r7b1f6d4 r276a94d7  
     1#[cfg(any(
     2        feature = "sync time rt-threaded",
     3  ))]
     4
     5extern crate tokio;
     6
     7use std::io::{self, Write};
    18use std::sync::Arc;
    2 use std::sync::atomic::Ordering;
    3 use std::time::Instant;
     9use std::sync::atomic::{AtomicU64, AtomicBool,Ordering};
     10use std::time::{Instant,Duration};
    411
    512use tokio::runtime::Builder;
    613use tokio::sync;
    7 
     14use tokio::time;
     15
     16extern crate isatty;
     17use isatty::stdout_isatty;
     18
     19extern crate num_format;
     20use num_format::{Locale, ToFormattedString};
     21
     22extern crate clap;
    823use clap::{Arg, App};
    9 use num_format::{Locale, ToFormattedString};
    10 
    11 #[path = "../bench.rs"]
    12 mod bench;
    13 
    14 // ==================================================
     24
     25use std::cell::UnsafeCell;
     26use std::mem::MaybeUninit;
     27use std::ops;
     28
     29pub struct InitializeCell<T> {
     30    inner: UnsafeCell<MaybeUninit<T>>,
     31}
     32
     33unsafe impl<T> Sync for InitializeCell<T> {}
     34
     35impl<T> InitializeCell<T> {
     36    pub const unsafe fn new_uninitialized() -> InitializeCell<T> {
     37          InitializeCell {
     38                inner: UnsafeCell::new(MaybeUninit::uninit()),
     39          }
     40    }
     41    pub const fn new(init: T) -> InitializeCell<T> {
     42          InitializeCell {
     43                inner: UnsafeCell::new(MaybeUninit::new(init)),
     44          }
     45    }
     46    pub unsafe fn init(&self, init: T) {
     47          (*self.inner.get()) = MaybeUninit::new(init);
     48    }
     49}
     50
     51impl<T> ops::Deref for InitializeCell<T> {
     52    type Target = T;
     53    fn deref(&self) -> &T {
     54          unsafe {
     55                &*(*self.inner.get()).as_ptr()
     56          }
     57    }
     58}
     59
     60static CLOCK_MODE: InitializeCell<bool> = unsafe { InitializeCell::new_uninitialized() };
     61static STOP_COUNT: InitializeCell<u64>  = unsafe { InitializeCell::new_uninitialized() };
     62static DURATION: InitializeCell<f64>    = unsafe { InitializeCell::new_uninitialized() };
     63static STOP         : AtomicBool = AtomicBool::new(false);
     64static THREADS_LEFT : AtomicU64  = AtomicU64 ::new(10);
     65
    1566struct Partner {
    1667        sem: sync::Semaphore,
     
    1869}
    1970
    20 async fn partner_main(idx: usize, others: Arc<Vec<Arc<Partner>>>, exp: Arc<bench::BenchData> ) -> u64 {
     71async fn partner_main(result: sync::oneshot::Sender<u64>, idx: usize, others: Arc<Vec<Arc<Partner>>> ) {
    2172        let this = &others[idx];
    2273        let mut count:u64 = 0;
     
    2677                count += 1;
    2778
    28                 if  exp.clock_mode && exp.stop.load(Ordering::Relaxed) { break; }
    29                 if !exp.clock_mode && count >= exp.stop_count { break; }
    30         }
    31 
    32         exp.threads_left.fetch_sub(1, Ordering::SeqCst);
    33         count
    34 }
    35 
    36 // ==================================================
     79                if  *CLOCK_MODE && STOP.load(Ordering::Relaxed) { break; }
     80                if !*CLOCK_MODE && count >= *STOP_COUNT { break; }
     81        }
     82
     83        THREADS_LEFT.fetch_sub(1, Ordering::SeqCst);
     84        result.send( count ).unwrap();
     85}
     86
     87fn prep(nthreads: usize, tthreads: usize) -> Vec<Arc<Partner>> {
     88        let mut thddata = Vec::with_capacity(tthreads);
     89        for i in 0..tthreads {
     90                let pi = (i + nthreads) % tthreads;
     91                thddata.push(Arc::new(Partner{
     92                        sem: sync::Semaphore::new(0),
     93                        next: pi,
     94                }));
     95        }
     96        return thddata;
     97}
     98
     99async fn wait(start: &Instant, is_tty: bool) {
     100        loop {
     101                time::sleep(Duration::from_micros(100000)).await;
     102                let delta = start.elapsed();
     103                if is_tty {
     104                        print!(" {:.1}\r", delta.as_secs_f32());
     105                        io::stdout().flush().unwrap();
     106                }
     107                if *CLOCK_MODE && delta >= Duration::from_secs_f64(*DURATION)  {
     108                        break;
     109                }
     110                else if !*CLOCK_MODE && THREADS_LEFT.load(Ordering::Relaxed) == 0 {
     111                        break;
     112                }
     113        }
     114}
     115
    37116fn main() {
    38117        let options = App::new("Cycle Tokio")
    39                 .args(&bench::args())
     118                .arg(Arg::with_name("duration")  .short("d").long("duration")  .takes_value(true).default_value("5").help("Duration of the experiments in seconds"))
     119                .arg(Arg::with_name("iterations").short("i").long("iterations").takes_value(true).conflicts_with("duration").help("Number of iterations of the experiments"))
     120                .arg(Arg::with_name("nthreads")  .short("t").long("nthreads")  .takes_value(true).default_value("1").help("Number of threads to use"))
     121                .arg(Arg::with_name("nprocs")    .short("p").long("nprocs")    .takes_value(true).default_value("1").help("Number of processors to use"))
    40122                .arg(Arg::with_name("ringsize")  .short("r").long("ringsize")  .takes_value(true).default_value("1").help("Number of threads in a cycle"))
    41123                .get_matches();
     
    45127        let nprocs    = options.value_of("nprocs").unwrap().parse::<usize>().unwrap();
    46128
    47         let tthreads = nthreads * ring_size;
    48         let exp = Arc::new(bench::BenchData::new(options, tthreads));
     129        if options.is_present("iterations") {
     130                unsafe{
     131                        CLOCK_MODE.init( false );
     132                        STOP_COUNT.init( options.value_of("iterations").unwrap().parse::<u64>().unwrap() );
     133                }
     134        }
     135        else {
     136                unsafe{
     137                        CLOCK_MODE.init(true);
     138                        DURATION  .init(options.value_of("duration").unwrap().parse::<f64>().unwrap());
     139                }
     140        }
    49141
    50142        let s = (1000000 as u64).to_formatted_string(&Locale::en);
    51143        assert_eq!(&s, "1,000,000");
    52144
    53         let thddata : Arc<Vec<Arc<Partner>>> = Arc::new(
    54                 (0..tthreads).map(|i| {
    55                         let pi = (i + nthreads) % tthreads;
    56                         Arc::new(Partner{
    57                                 sem: sync::Semaphore::new(0),
    58                                 next: pi,
    59                         })
    60                 }).collect()
    61         );
     145
     146        let tthreads = nthreads * ring_size;
     147        THREADS_LEFT.store(tthreads as u64, Ordering::SeqCst);
     148        let thddata = Arc::new(prep(nthreads, tthreads));
    62149
    63150        let mut global_counter :u64 = 0;
     
    70157
    71158        runtime.block_on(async {
    72                 let threads: Vec<_> = (0..tthreads).map(|i| {
    73                         tokio::spawn(partner_main(i, thddata.clone(), exp.clone()))
    74                 }).collect();
    75                 println!("Starting");
    76 
    77                 let start = Instant::now();
    78 
    79                 for i in 0..nthreads {
    80                         thddata[i].sem.add_permits(1);
    81                 }
    82 
    83                 duration = exp.wait(&start).await;
    84 
    85                 println!("\nDone");
    86 
    87                 for i in 0..tthreads {
    88                         thddata[i].sem.add_permits(1);
    89                 }
    90 
    91                 for t in threads {
    92                         global_counter += t.await.unwrap();
     159                let mut result  : Vec<sync::oneshot::Receiver::<u64>> = Vec::with_capacity(tthreads);
     160                {
     161                        let mut threads = Vec::with_capacity(tthreads);
     162                        for i in 0..tthreads {
     163                                let (s, r) = sync::oneshot::channel::<u64>();
     164                                result.push(r);
     165                                threads.push(tokio::spawn(partner_main(s, i, thddata.clone())));
     166                        }
     167                        println!("Starting");
     168
     169                        let is_tty = stdout_isatty();
     170                        let start = Instant::now();
     171
     172                        for i in 0..nthreads {
     173                                thddata[i].sem.add_permits(1);
     174                        }
     175
     176                        wait(&start, is_tty).await;
     177
     178                        STOP.store(true, Ordering::SeqCst);
     179                        duration = start.elapsed();
     180
     181                        println!("\nDone");
     182
     183                        for i in 0..tthreads {
     184                                thddata[i].sem.add_permits(1);
     185                        }
     186
     187                        for _ in 0..tthreads {
     188                                global_counter += result.pop().unwrap().await.unwrap();
     189                        }
    93190                }
    94191        });
  • benchmark/readyQ/locality.go

    r7b1f6d4 r276a94d7  
    215215func main() {
    216216        // Benchmark specific command line arguments
    217         work_sizeOpt := flag.Uint64("w", 2    , "Size of the array for each threads, in words (64bit)")
    218         countOpt     := flag.Uint64("c", 2    , "Number of words to touch when working (random pick, cells can be picked more than once)")
     217        work_sizeOpt := flag.Uint64("w", 2    , "Number of words (uint64) per threads")
     218        countOpt     := flag.Uint64("c", 2    , "Number of words (uint64) to touch")
    219219        shareOpt     := flag.Bool  ("s", false, "Pass the work data to the next thread when blocking")
    220220
     
    266266
    267267        // Join and accumulate results
    268         results := NewResult()
     268        global_result := NewResult()
    269269        for i := 0; i < nthreads; i++ {
    270270                r := <- result
    271                 results.count += r.count
    272                 results.gmigs += r.gmigs
    273                 results.dmigs += r.dmigs
     271                global_result.count += r.count
     272                global_result.gmigs += r.gmigs
     273                global_result.dmigs += r.dmigs
    274274        }
    275275
     
    280280        p.Printf("Number of threads      : %d\n", nthreads);
    281281        p.Printf("Work size (64bit words): %d\n", size);
    282         p.Printf("Total Operations(ops)  : %15d\n", results.count)
    283         p.Printf("Total G Migrations     : %15d\n", results.gmigs)
    284         p.Printf("Total D Migrations     : %15d\n", results.dmigs)
    285         p.Printf("Ops per second         : %18.2f\n", float64(results.count) / delta.Seconds())
    286         p.Printf("ns per ops             : %18.2f\n", float64(delta.Nanoseconds()) / float64(results.count))
    287         p.Printf("Ops per threads        : %15d\n", results.count / uint64(nthreads))
    288         p.Printf("Ops per procs          : %15d\n", results.count / uint64(nprocs))
    289         p.Printf("Ops/sec/procs          : %18.2f\n", (float64(results.count) / float64(nprocs)) / delta.Seconds())
    290         p.Printf("ns per ops/procs       : %18.2f\n", float64(delta.Nanoseconds()) / (float64(results.count) / float64(nprocs)))
    291 }
     282        p.Printf("Total Operations(ops)  : %15d\n", global_result.count)
     283        p.Printf("Total G Migrations     : %15d\n", global_result.gmigs)
     284        p.Printf("Total D Migrations     : %15d\n", global_result.dmigs)
     285        p.Printf("Ops per second         : %18.2f\n", float64(global_result.count) / delta.Seconds())
     286        p.Printf("ns per ops             : %18.2f\n", float64(delta.Nanoseconds()) / float64(global_result.count))
     287        p.Printf("Ops per threads        : %15d\n", global_result.count / uint64(nthreads))
     288        p.Printf("Ops per procs          : %15d\n", global_result.count / uint64(nprocs))
     289        p.Printf("Ops/sec/procs          : %18.2f\n", (float64(global_result.count) / float64(nprocs)) / delta.Seconds())
     290        p.Printf("ns per ops/procs       : %18.2f\n", float64(delta.Nanoseconds()) / (float64(global_result.count) / float64(nprocs)))
     291}
  • configure.ac

    r7b1f6d4 r276a94d7  
    295295# Some of our makefile don't need to be distributed
    296296AM_CONDITIONAL([CFORALL_DISTRIBUTE], [test -e $TOP_SRCDIR/autogen.sh])
    297 AM_COND_IF([CFORALL_DISTRIBUTE], [
    298         AC_CONFIG_FILES([
     297AM_COND_IF([CFORALL_DISTRIBUTE],
     298        [AC_CONFIG_FILES([
    299299                longrun_tests/Makefile
    300300                benchmark/Makefile
     
    302302                tools/Makefile
    303303                tools/prettyprinter/Makefile
    304         ])
    305 
    306         AC_OUTPUT(benchmark/Cargo.toml)
    307 ])
     304                ])])
    308305
    309306AC_CONFIG_LINKS([tests/test.py:tests/test.py])
Note: See TracChangeset for help on using the changeset viewer.