source: libcfa/src/concurrency/stats.cfa @ bdce852

ADTarm-ehast-experimentalenumforall-pointer-decayjacob/cs343-translationnew-astnew-ast-unique-exprpthread-emulationqualifiedEnum
Last change on this file since bdce852 was 69fbc61, checked in by Thierry Delisle <tdelisle@…>, 4 years ago

Clusters/Processors? can now select which stats to print.
Instead of all or nothing.

  • Property mode set to 100644
File size: 8.5 KB
Line 
1#include <stdint.h>
2#include <stdlib.hfa>
3
4#include <unistd.h>                                                             // STDERR_FILENO
5#include "bits/debug.hfa"
6#include "stats.hfa"
7
8#if !defined(__CFA_NO_STATISTICS__)
9        void __init_stats( struct __stats_t * stats ) {
10                stats->ready.pick.push.attempt  = 0;
11                stats->ready.pick.push.success  = 0;
12                stats->ready.pick.push.local    = 0;
13                stats->ready.pick.push.lsuccess = 0;
14                stats->ready.pick.pop .probe    = 0;
15                stats->ready.pick.pop .attempt  = 0;
16                stats->ready.pick.pop .success  = 0;
17                stats->ready.pick.pop .local    = 0;
18                stats->ready.pick.pop .lsuccess = 0;
19                stats->ready.threads.migration = 0;
20                stats->ready.sleep.halts   = 0;
21                stats->ready.sleep.cancels = 0;
22                stats->ready.sleep.wakes   = 0;
23                stats->ready.sleep.exits   = 0;
24
25                #if defined(HAVE_LINUX_IO_URING_H)
26                        stats->io.submit_q.submit_avg.rdy = 0;
27                        stats->io.submit_q.submit_avg.csm = 0;
28                        stats->io.submit_q.submit_avg.avl = 0;
29                        stats->io.submit_q.submit_avg.cnt = 0;
30                        stats->io.submit_q.look_avg.val   = 0;
31                        stats->io.submit_q.look_avg.cnt   = 0;
32                        stats->io.submit_q.look_avg.block = 0;
33                        stats->io.submit_q.alloc_avg.val   = 0;
34                        stats->io.submit_q.alloc_avg.cnt   = 0;
35                        stats->io.submit_q.alloc_avg.block = 0;
36                        stats->io.complete_q.completed_avg.val = 0;
37                        stats->io.complete_q.completed_avg.slow_cnt = 0;
38                        stats->io.complete_q.completed_avg.fast_cnt = 0;
39                #endif
40        }
41
42        void __tally_stats( struct __stats_t * cltr, struct __stats_t * proc ) {
43                __atomic_fetch_add( &cltr->ready.pick.push.attempt , proc->ready.pick.push.attempt , __ATOMIC_SEQ_CST );
44                __atomic_fetch_add( &cltr->ready.pick.push.success , proc->ready.pick.push.success , __ATOMIC_SEQ_CST );
45                __atomic_fetch_add( &cltr->ready.pick.push.local   , proc->ready.pick.push.local   , __ATOMIC_SEQ_CST );
46                __atomic_fetch_add( &cltr->ready.pick.push.lsuccess, proc->ready.pick.push.lsuccess, __ATOMIC_SEQ_CST );
47                __atomic_fetch_add( &cltr->ready.pick.pop .probe   , proc->ready.pick.pop .probe   , __ATOMIC_SEQ_CST );
48                __atomic_fetch_add( &cltr->ready.pick.pop .attempt , proc->ready.pick.pop .attempt , __ATOMIC_SEQ_CST );
49                __atomic_fetch_add( &cltr->ready.pick.pop .success , proc->ready.pick.pop .success , __ATOMIC_SEQ_CST );
50                __atomic_fetch_add( &cltr->ready.pick.pop .local   , proc->ready.pick.pop .local   , __ATOMIC_SEQ_CST );
51                __atomic_fetch_add( &cltr->ready.pick.pop .lsuccess, proc->ready.pick.pop .lsuccess, __ATOMIC_SEQ_CST );
52                __atomic_fetch_add( &cltr->ready.threads.migration, proc->ready.threads.migration, __ATOMIC_SEQ_CST );
53                __atomic_fetch_add( &cltr->ready.sleep.halts  , proc->ready.sleep.halts  , __ATOMIC_SEQ_CST );
54                __atomic_fetch_add( &cltr->ready.sleep.cancels, proc->ready.sleep.cancels, __ATOMIC_SEQ_CST );
55                __atomic_fetch_add( &cltr->ready.sleep.wakes  , proc->ready.sleep.wakes  , __ATOMIC_SEQ_CST );
56                __atomic_fetch_add( &cltr->ready.sleep.exits  , proc->ready.sleep.exits  , __ATOMIC_SEQ_CST );
57
58                #if defined(HAVE_LINUX_IO_URING_H)
59                        __atomic_fetch_add( &cltr->io.submit_q.submit_avg.rdy          , proc->io.submit_q.submit_avg.rdy          , __ATOMIC_SEQ_CST );
60                        __atomic_fetch_add( &cltr->io.submit_q.submit_avg.csm          , proc->io.submit_q.submit_avg.csm          , __ATOMIC_SEQ_CST );
61                        __atomic_fetch_add( &cltr->io.submit_q.submit_avg.avl          , proc->io.submit_q.submit_avg.avl          , __ATOMIC_SEQ_CST );
62                        __atomic_fetch_add( &cltr->io.submit_q.submit_avg.cnt          , proc->io.submit_q.submit_avg.cnt          , __ATOMIC_SEQ_CST );
63                        __atomic_fetch_add( &cltr->io.submit_q.look_avg.val            , proc->io.submit_q.look_avg.val            , __ATOMIC_SEQ_CST );
64                        __atomic_fetch_add( &cltr->io.submit_q.look_avg.cnt            , proc->io.submit_q.look_avg.cnt            , __ATOMIC_SEQ_CST );
65                        __atomic_fetch_add( &cltr->io.submit_q.look_avg.block          , proc->io.submit_q.look_avg.block          , __ATOMIC_SEQ_CST );
66                        __atomic_fetch_add( &cltr->io.submit_q.alloc_avg.val           , proc->io.submit_q.alloc_avg.val           , __ATOMIC_SEQ_CST );
67                        __atomic_fetch_add( &cltr->io.submit_q.alloc_avg.cnt           , proc->io.submit_q.alloc_avg.cnt           , __ATOMIC_SEQ_CST );
68                        __atomic_fetch_add( &cltr->io.submit_q.alloc_avg.block         , proc->io.submit_q.alloc_avg.block         , __ATOMIC_SEQ_CST );
69                        __atomic_fetch_add( &cltr->io.complete_q.completed_avg.val     , proc->io.complete_q.completed_avg.val     , __ATOMIC_SEQ_CST );
70                        __atomic_fetch_add( &cltr->io.complete_q.completed_avg.slow_cnt, proc->io.complete_q.completed_avg.slow_cnt, __ATOMIC_SEQ_CST );
71                        __atomic_fetch_add( &cltr->io.complete_q.completed_avg.fast_cnt, proc->io.complete_q.completed_avg.fast_cnt, __ATOMIC_SEQ_CST );
72                #endif
73        }
74
75        void __print_stats( struct __stats_t * stats, int flags, bool cluster, const char * name, void * id ) with( *stats ) {
76
77                if( flags & CFA_STATS_READY_Q ) {
78                        double push_sur = (100.0 * ((double)ready.pick.push.success) / ready.pick.push.attempt);
79                        double pop_sur  = (100.0 * ((double)ready.pick.pop .success) / ready.pick.pop .attempt);
80
81                        double push_len = ((double)ready.pick.push.attempt) / ready.pick.push.success;
82                        double pop_len  = ((double)ready.pick.pop .attempt) / ready.pick.pop .success;
83
84                        double lpush_sur = (100.0 * ((double)ready.pick.push.lsuccess) / ready.pick.push.local);
85                        double lpop_sur  = (100.0 * ((double)ready.pick.pop .lsuccess) / ready.pick.pop .local);
86
87                        double lpush_len = ((double)ready.pick.push.local) / ready.pick.push.lsuccess;
88                        double lpop_len  = ((double)ready.pick.pop .local) / ready.pick.pop .lsuccess;
89
90                        __cfaabi_bits_print_safe( STDOUT_FILENO,
91                                "----- %s \"%s\" (%p) - Ready Q Stats -----\n"
92                                "- total threads run      : %'15lu\n"
93                                "- total threads scheduled: %'15lu\n"
94                                "- push average probe len : %'18.2lf, %'18.2lf%% (%'15lu attempts)\n"
95                                "- pop  average probe len : %'18.2lf, %'18.2lf%% (%'15lu attempts)\n"
96                                "- local push avg prb len : %'18.2lf, %'18.2lf%% (%'15lu attempts)\n"
97                                "- local pop  avg prb len : %'18.2lf, %'18.2lf%% (%'15lu attempts)\n"
98                                "- thread migrations      : %'15lu\n"
99                                "- Idle Sleep -\n"
100                                "-- halts                 : %'15lu\n"
101                                "-- cancelled halts       : %'15lu\n"
102                                "-- schedule wake         : %'15lu\n"
103                                "-- wake on exit          : %'15lu\n"
104                                "\n"
105                                , cluster ? "Cluster" : "Processor",  name, id
106                                , ready.pick.pop.success
107                                , ready.pick.push.success
108                                , push_len, push_sur, ready.pick.push.attempt
109                                , pop_len , pop_sur , ready.pick.pop .attempt
110                                , lpush_len, lpush_sur, ready.pick.push.local
111                                , lpop_len , lpop_sur , ready.pick.pop .local
112                                , ready.threads.migration
113                                , ready.sleep.halts, ready.sleep.cancels, ready.sleep.wakes, ready.sleep.exits
114                        );
115                }
116
117                #if defined(HAVE_LINUX_IO_URING_H)
118                        if( flags & CFA_STATS_IO ) {
119                                double avgrdy = ((double)io.submit_q.submit_avg.rdy) / io.submit_q.submit_avg.cnt;
120                                double avgcsm = ((double)io.submit_q.submit_avg.csm) / io.submit_q.submit_avg.cnt;
121                                double avgavl = ((double)io.submit_q.submit_avg.avl) / io.submit_q.submit_avg.cnt;
122
123                                double lavgv = 0;
124                                double lavgb = 0;
125                                if(io.submit_q.look_avg.cnt != 0) {
126                                        lavgv = ((double)io.submit_q.look_avg.val  ) / io.submit_q.look_avg.cnt;
127                                        lavgb = ((double)io.submit_q.look_avg.block) / io.submit_q.look_avg.cnt;
128                                }
129
130                                double aavgv = 0;
131                                double aavgb = 0;
132                                if(io.submit_q.alloc_avg.cnt != 0) {
133                                        aavgv = ((double)io.submit_q.alloc_avg.val  ) / io.submit_q.alloc_avg.cnt;
134                                        aavgb = ((double)io.submit_q.alloc_avg.block) / io.submit_q.alloc_avg.cnt;
135                                }
136
137                                __cfaabi_bits_print_safe( STDOUT_FILENO,
138                                        "----- %s \"%s\" (%p) - I/O Stats -----\n"
139                                        "- total submit calls     : %'15lu\n"
140                                        "- avg ready entries      : %'18.2lf\n"
141                                        "- avg submitted entries  : %'18.2lf\n"
142                                        "- avg available entries  : %'18.2lf\n"
143                                        "- total ready search     : %'15lu\n"
144                                        "- avg ready search len   : %'18.2lf\n"
145                                        "- avg ready search block : %'18.2lf\n"
146                                        "- total alloc search     : %'15lu\n"
147                                        "- avg alloc search len   : %'18.2lf\n"
148                                        "- avg alloc search block : %'18.2lf\n"
149                                        "- total wait calls       : %'15lu   (%'lu slow, %'lu fast)\n"
150                                        "- avg completion/wait    : %'18.2lf\n"
151                                        "\n"
152                                        , cluster ? "Cluster" : "Processor",  name, id
153                                        , io.submit_q.submit_avg.cnt
154                                        , avgrdy, avgcsm, avgavl
155                                        , io.submit_q.look_avg.cnt
156                                        , lavgv, lavgb
157                                        , io.submit_q.alloc_avg.cnt
158                                        , aavgv, aavgb
159                                        , io.complete_q.completed_avg.slow_cnt + io.complete_q.completed_avg.fast_cnt
160                                        , io.complete_q.completed_avg.slow_cnt,  io.complete_q.completed_avg.fast_cnt
161                                        , ((double)io.complete_q.completed_avg.val) / (io.complete_q.completed_avg.slow_cnt + io.complete_q.completed_avg.fast_cnt)
162                                );
163                        }
164                #endif
165        }
166#endif
Note: See TracBrowser for help on using the repository browser.