source: libcfa/src/concurrency/stats.cfa @ 74227c6

ADTast-experimental
Last change on this file since 74227c6 was 74227c6, checked in by Thierry Delisle <tdelisle@…>, 17 months ago

Added more stats

  • Property mode set to 100644
File size: 13.5 KB
Line 
1#include <stdint.h>
2#include <stdlib.hfa>
3
4#include <unistd.h>                                                             // STDERR_FILENO
5#include <inttypes.h>
6#include "bits/debug.hfa"
7#include "bits/locks.hfa"
8#include "stats.hfa"
9#include "strstream.hfa"
10
11#if !defined(__CFA_NO_STATISTICS__)
12        void __init_stats( struct __stats_t * stats ) {
13                stats->ready.push.local.attempt = 0;
14                stats->ready.push.local.success = 0;
15                stats->ready.push.share.attempt = 0;
16                stats->ready.push.share.success = 0;
17                stats->ready.push.extrn.attempt = 0;
18                stats->ready.push.extrn.success = 0;
19                stats->ready.pop.local .attempt = 0;
20                stats->ready.pop.local .success = 0;
21                stats->ready.pop.help  .attempt = 0;
22                stats->ready.pop.help  .success = 0;
23                stats->ready.pop.steal .attempt = 0;
24                stats->ready.pop.steal .success = 0;
25                stats->ready.pop.search.attempt = 0;
26                stats->ready.pop.search.success = 0;
27                stats->ready.threads.migration = 0;
28                stats->ready.threads.extunpark = 0;
29                stats->ready.threads.threads   = 0;
30                stats->ready.threads.cthreads  = 0;
31                stats->ready.threads.preempt.yield  = 0;
32                stats->ready.threads.preempt.rllfwd = 0;
33                stats->ready.sleep.halts   = 0;
34                stats->ready.sleep.cancels = 0;
35                stats->ready.sleep.early   = 0;
36                stats->ready.sleep.wakes   = 0;
37                stats->ready.sleep.seen    = 0;
38                stats->ready.sleep.exits   = 0;
39
40                #if defined(CFA_HAVE_LINUX_IO_URING_H)
41                        stats->io.alloc.fast        = 0;
42                        stats->io.alloc.slow        = 0;
43                        stats->io.alloc.fail        = 0;
44                        stats->io.alloc.revoke      = 0;
45                        stats->io.alloc.block       = 0;
46                        stats->io.submit.fast       = 0;
47                        stats->io.submit.slow       = 0;
48                        stats->io.submit.eagr       = 0;
49                        stats->io.submit.nblk       = 0;
50                        stats->io.submit.extr       = 0;
51                        stats->io.flush.external    = 0;
52                        stats->io.flush.signal      = 0;
53                        stats->io.flush.dirty       = 0;
54                        stats->io.flush.full        = 0;
55                        stats->io.flush.idle        = 0;
56                        stats->io.flush.eager       = 0;
57                        stats->io.calls.flush       = 0;
58                        stats->io.calls.submitted   = 0;
59                        stats->io.calls.drain       = 0;
60                        stats->io.calls.completed   = 0;
61                        stats->io.calls.locked      = 0;
62                        stats->io.calls.helped      = 0;
63                        stats->io.calls.errors.busy = 0;
64                        stats->io.ops.sockread      = 0;
65                        stats->io.ops.epllread      = 0;
66                        stats->io.ops.sockwrite     = 0;
67                        stats->io.ops.epllwrite     = 0;
68                #endif
69
70                #if defined(CFA_STATS_ARRAY)
71                        stats->array.values = alloc(CFA_STATS_ARRAY);
72                        stats->array.cnt = 0;
73                #endif
74        }
75
76        static inline void tally_one( volatile uint64_t * agg, volatile uint64_t * val) {
77                uint64_t add = __atomic_exchange_n(val, 0_l64u, __ATOMIC_RELAXED);
78                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
79        }
80
81        static inline void tally_one( volatile int64_t * agg, volatile int64_t * val) {
82                int64_t add = __atomic_exchange_n(val, 0_l64, __ATOMIC_RELAXED);
83                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
84        }
85
86        void __tally_stats( struct __stats_t * cltr, struct __stats_t * proc ) {
87                tally_one( &cltr->ready.push.local.attempt    , &proc->ready.push.local.attempt     );
88                tally_one( &cltr->ready.push.local.success    , &proc->ready.push.local.success     );
89                tally_one( &cltr->ready.push.share.attempt    , &proc->ready.push.share.attempt     );
90                tally_one( &cltr->ready.push.share.success    , &proc->ready.push.share.success     );
91                tally_one( &cltr->ready.push.extrn.attempt    , &proc->ready.push.extrn.attempt     );
92                tally_one( &cltr->ready.push.extrn.success    , &proc->ready.push.extrn.success     );
93                tally_one( &cltr->ready.pop.local .attempt    , &proc->ready.pop.local .attempt     );
94                tally_one( &cltr->ready.pop.local .success    , &proc->ready.pop.local .success     );
95                tally_one( &cltr->ready.pop.help  .attempt    , &proc->ready.pop.help  .attempt     );
96                tally_one( &cltr->ready.pop.help  .success    , &proc->ready.pop.help  .success     );
97                tally_one( &cltr->ready.pop.steal .attempt    , &proc->ready.pop.steal .attempt     );
98                tally_one( &cltr->ready.pop.steal .success    , &proc->ready.pop.steal .success     );
99                tally_one( &cltr->ready.pop.search.attempt    , &proc->ready.pop.search.attempt     );
100                tally_one( &cltr->ready.pop.search.success    , &proc->ready.pop.search.success     );
101                tally_one( &cltr->ready.threads.migration     , &proc->ready.threads.migration      );
102                tally_one( &cltr->ready.threads.extunpark     , &proc->ready.threads.extunpark      );
103                tally_one( &cltr->ready.threads.threads       , &proc->ready.threads.threads        );
104                tally_one( &cltr->ready.threads.cthreads      , &proc->ready.threads.cthreads       );
105                tally_one( &cltr->ready.threads.preempt.yield , &proc->ready.threads.preempt.yield  );
106                tally_one( &cltr->ready.threads.preempt.rllfwd, &proc->ready.threads.preempt.rllfwd );
107                tally_one( &cltr->ready.sleep.halts           , &proc->ready.sleep.halts            );
108                tally_one( &cltr->ready.sleep.cancels         , &proc->ready.sleep.cancels          );
109                tally_one( &cltr->ready.sleep.early           , &proc->ready.sleep.early            );
110                tally_one( &cltr->ready.sleep.wakes           , &proc->ready.sleep.wakes            );
111                tally_one( &cltr->ready.sleep.seen            , &proc->ready.sleep.wakes            );
112                tally_one( &cltr->ready.sleep.exits           , &proc->ready.sleep.exits            );
113
114                #if defined(CFA_HAVE_LINUX_IO_URING_H)
115                        tally_one( &cltr->io.alloc.fast       , &proc->io.alloc.fast        );
116                        tally_one( &cltr->io.alloc.slow       , &proc->io.alloc.slow        );
117                        tally_one( &cltr->io.alloc.fail       , &proc->io.alloc.fail        );
118                        tally_one( &cltr->io.alloc.revoke     , &proc->io.alloc.revoke      );
119                        tally_one( &cltr->io.alloc.block      , &proc->io.alloc.block       );
120                        tally_one( &cltr->io.submit.fast      , &proc->io.submit.fast       );
121                        tally_one( &cltr->io.submit.slow      , &proc->io.submit.slow       );
122                        tally_one( &cltr->io.submit.eagr      , &proc->io.submit.eagr       );
123                        tally_one( &cltr->io.submit.nblk      , &proc->io.submit.nblk       );
124                        tally_one( &cltr->io.submit.extr      , &proc->io.submit.extr       );
125                        tally_one( &cltr->io.flush.external   , &proc->io.flush.external    );
126                        tally_one( &cltr->io.flush.signal     , &proc->io.flush.signal      );
127                        tally_one( &cltr->io.flush.dirty      , &proc->io.flush.dirty       );
128                        tally_one( &cltr->io.flush.full       , &proc->io.flush.full        );
129                        tally_one( &cltr->io.flush.idle       , &proc->io.flush.idle        );
130                        tally_one( &cltr->io.flush.eager      , &proc->io.flush.eager       );
131                        tally_one( &cltr->io.calls.flush      , &proc->io.calls.flush       );
132                        tally_one( &cltr->io.calls.submitted  , &proc->io.calls.submitted   );
133                        tally_one( &cltr->io.calls.drain      , &proc->io.calls.drain       );
134                        tally_one( &cltr->io.calls.completed  , &proc->io.calls.completed   );
135                        tally_one( &cltr->io.calls.locked     , &proc->io.calls.locked      );
136                        tally_one( &cltr->io.calls.helped     , &proc->io.calls.helped      );
137                        tally_one( &cltr->io.calls.errors.busy, &proc->io.calls.errors.busy );
138                        tally_one( &cltr->io.ops.sockread     , &proc->io.ops.sockread      );
139                        tally_one( &cltr->io.ops.epllread     , &proc->io.ops.epllread      );
140                        tally_one( &cltr->io.ops.sockwrite    , &proc->io.ops.sockwrite     );
141                        tally_one( &cltr->io.ops.epllwrite    , &proc->io.ops.epllwrite     );
142                #endif
143        }
144
145        #define eng3(X) (ws(3, 3, unit(eng( X ))))
146
147        void __print_stats( struct __stats_t * stats, int flags, const char * type, const char * name, void * id ) with( *stats ) {
148
149                char buf[1024];
150                ostrstream sstr = { buf, 1024 };
151
152                if( flags & CFA_STATS_READY_Q ) {
153
154                        sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - Ready Q Stats -----";
155
156                        uint64_t totalR = ready.pop.local.success + ready.pop.help.success + ready.pop.steal.success + ready.pop.search.success;
157                        uint64_t totalS = ready.push.local.success + ready.push.share.success + ready.push.extrn.success;
158                        sstr | "- totals   : " | eng3(totalR) | "run," | eng3(totalS) | "schd (" | eng3(ready.push.extrn.success) | "ext,"
159                             | eng3(ready.threads.migration) | "mig," | eng3(ready.threads.extunpark) | " eupk," | ready.threads.threads | " t," | ready.threads.cthreads | " cthr)";
160
161                        double push_len = ((double)ready.push.local.attempt + ready.push.share.attempt + ready.push.extrn.attempt) / totalS;
162                        double sLcl_len = ready.push.local.success ? ((double)ready.push.local.attempt) / ready.push.local.success : 0;
163                        double sOth_len = ready.push.share.success ? ((double)ready.push.share.attempt) / ready.push.share.success : 0;
164                        double sExt_len = ready.push.extrn.success ? ((double)ready.push.extrn.attempt) / ready.push.extrn.success : 0;
165                        sstr | "- push avg : " | ws(3, 3, push_len)
166                             | "- l: " | eng3(ready.push.local.attempt) | " (" | ws(3, 3, sLcl_len) | ")"
167                             | ", s: " | eng3(ready.push.share.attempt) | " (" | ws(3, 3, sOth_len) | ")"
168                             | ", e: " | eng3(ready.push.extrn.attempt) | " (" | ws(3, 3, sExt_len) | ")";
169
170                        double rLcl_pc = (100.0 * (double)ready.pop.local .success) / totalR;
171                        sstr | "- local    : " | eng3(ready.pop.local .success) | "-"| ws(3, 3, rLcl_pc) | '%'
172                             | " (" | eng3(ready.pop.local .attempt) | " try)";
173                        double rHlp_pc = (100.0 * (double)ready.pop.help  .success) / totalR;
174                        sstr | "- help     : " | eng3(ready.pop.help  .success) | "-"| ws(3, 3, rHlp_pc) | '%'
175                             | " (" | eng3(ready.pop.help  .attempt) | " try)";
176                        double rStl_pc = (100.0 * (double)ready.pop.steal .success) / totalR;
177                        sstr | "- steal    : " | eng3(ready.pop.steal .success) | "-"| ws(3, 3, rStl_pc) | '%'
178                             | " (" | eng3(ready.pop.steal .attempt) | " try)";
179                        double rSch_pc = (100.0 * (double)ready.pop.search.success) / totalR;
180                        sstr | "- search   : " | eng3(ready.pop.search.success) | "-"| ws(3, 3, rSch_pc) | '%'
181                             | " (" | eng3(ready.pop.search.attempt) | " try)";
182
183                        sstr | "- Idle Slp : " | eng3(ready.sleep.halts) | "halt," | eng3(ready.sleep.cancels) | "cancel,"
184                             | eng3(ready.sleep.wakes + ready.sleep.early) | '(' | eng3(ready.sleep.early) | ',' | eng3(ready.sleep.seen) | ')' | " wake(early, seen),"
185                             | eng3(ready.sleep.exits) | "exit";
186                        sstr | "- Preemption : " | eng3(ready.threads.preempt.yield) | "yields," | eng3(ready.threads.preempt.rllfwd) | "delayed";
187                        sstr | nl;
188                }
189
190                #if defined(CFA_HAVE_LINUX_IO_URING_H)
191                        if( flags & CFA_STATS_IO ) {
192                                sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - I/O Stats -----";
193
194                                uint64_t total_allocs = io.alloc.fast + io.alloc.slow;
195
196                                uint64_t total_submits = io.submit.fast + io.submit.slow;
197                                sstr | "- totals : allc" | eng3(io.alloc .fast) | nonl;
198                                if(io.alloc.slow) {
199                                        double avgfasta = (100.0 * (double)io.alloc.fast) / total_allocs;
200                                        sstr | "fast," | eng3(io.alloc .slow) | "slow (" | ws(3, 3, avgfasta) | "%)" | nonl;
201                                }
202                                sstr | " - subm" | eng3(io.submit.fast) | nonl;
203                                if(io.alloc.slow) {
204                                        double avgfasts = (100.0 * (double)io.submit.fast) / total_submits;
205                                        sstr | "fast," | eng3(io.submit.slow) | "slow (" | ws(3, 3, avgfasts) | "%)," | eng3(io.submit.extr) | "external" | nonl;
206                                }
207                                sstr | " - eager" | eng3(io.submit.eagr) | nonl;
208                                sstr | " - no-wait" | eng3(io.submit.nblk) | nonl;
209                                sstr | nl;
210
211                                if(io.alloc.fail || io.alloc.revoke || io.alloc.block)
212                                        sstr | "-     failures      : " | eng3(io.alloc.fail) | "oom, " | eng3(io.alloc.revoke) | "rvk, " | eng3(io.alloc.block) | "blk";
213                                // if(io.flush.external)
214                                //      sstr | "- flush external    : " | eng3(io.flush.external);
215
216                                double avgsubs = ((double)io.calls.submitted) / io.calls.flush;
217                                double avgcomp = ((double)io.calls.completed) / io.calls.drain;
218                                sstr | "- syscll : "
219                                     |   " sub " | eng3(io.calls.submitted) | "/" | eng3(io.calls.flush) | "(" | ws(3, 3, avgsubs) | "/flush)"
220                                     | " - cmp " | eng3(io.calls.completed) | "/" | eng3(io.calls.drain) | "(" | ws(3, 3, avgcomp) | "/drain)"
221                                     | " - cmp " | eng3(io.calls.locked) | "locked, " | eng3(io.calls.helped) | "helped"
222                                     | " - " | eng3(io.calls.errors.busy) | " EBUSY";
223                                sstr | " - sub: " | eng3(io.flush.full) | "full, " | eng3(io.flush.dirty) | "drty, " | eng3(io.flush.idle) | "idle, " | eng3(io.flush.eager) | "eagr, " | eng3(io.flush.external) | '/' | eng3(io.flush.signal) | "ext";
224                                sstr | "- ops blk: "
225                                     |   " sk rd: " | eng3(io.ops.sockread)  | "epll: " | eng3(io.ops.epllread)
226                                     |   " sk wr: " | eng3(io.ops.sockwrite) | "epll: " | eng3(io.ops.epllwrite);
227                                sstr | nl;
228                        }
229                #endif
230
231                if(flags) write( sstr, stdout );
232        }
233
234        #if defined(CFA_STATS_ARRAY)
235                extern "C" {
236                        #include <stdio.h>
237                        #include <errno.h>
238                        #include <sys/stat.h>
239                        #include <fcntl.h>
240                }
241
242                void __flush_stat( struct __stats_t * this, const char * name, void * handle) {
243                        int ret = mkdir(".cfadata", 0755);
244                        if(ret < 0 && errno != EEXIST) abort("Failed to create directory .cfadata: %d\n", errno);
245
246                        char filename[100];
247                        snprintf(filename, 100, ".cfadata/%s%p.data", name, handle);
248
249                        int fd = open(filename, O_WRONLY | O_APPEND | O_CREAT, 0644);
250                        if(fd < 0) abort("Failed to create file %s: %d\n", filename, errno);
251
252                        for(i; this->array.cnt) {
253                                char line[100];
254                                size_t n = snprintf(line, 100, "%llu, %lld\n", this->array.values[i].ts, this->array.values[i].value);
255                                write(fd, line, n);
256                        }
257
258                        this->array.cnt = 0;
259                        close(fd);
260                }
261
262                static __spinlock_t stats_lock;
263
264                void __push_stat( struct __stats_t * this, int64_t value, bool external, const char * name, void * handle ) {
265                        if(external) lock(stats_lock __cfaabi_dbg_ctx2);
266
267                        if( this->array.cnt >= CFA_STATS_ARRAY ) __flush_stat( this, name, handle );
268
269                        size_t idx = this->array.cnt;
270                        this->array.cnt++;
271
272                        if(external) unlock(stats_lock);
273
274                        this->array.values[idx].ts = rdtscl();
275                        this->array.values[idx].value = value;
276                }
277        #endif
278#endif
Note: See TracBrowser for help on using the repository browser.