source: libcfa/src/concurrency/stats.cfa @ 9dc0836

ADTast-experimentalenumforall-pointer-decaypthread-emulationqualifiedEnum
Last change on this file since 9dc0836 was 941e14a, checked in by Thierry Delisle <tdelisle@…>, 3 years ago

Added statistics for preemption

  • Property mode set to 100644
File size: 12.5 KB
Line 
1#include <stdint.h>
2#include <stdlib.hfa>
3
4#include <unistd.h>                                                             // STDERR_FILENO
5#include <inttypes.h>
6#include "bits/debug.hfa"
7#include "bits/locks.hfa"
8#include "stats.hfa"
9#include "strstream.hfa"
10
11#if !defined(__CFA_NO_STATISTICS__)
12        void __init_stats( struct __stats_t * stats ) {
13                stats->ready.push.local.attempt = 0;
14                stats->ready.push.local.success = 0;
15                stats->ready.push.share.attempt = 0;
16                stats->ready.push.share.success = 0;
17                stats->ready.push.extrn.attempt = 0;
18                stats->ready.push.extrn.success = 0;
19                stats->ready.pop.local .attempt = 0;
20                stats->ready.pop.local .success = 0;
21                stats->ready.pop.help  .attempt = 0;
22                stats->ready.pop.help  .success = 0;
23                stats->ready.pop.steal .attempt = 0;
24                stats->ready.pop.steal .success = 0;
25                stats->ready.pop.search.attempt = 0;
26                stats->ready.pop.search.success = 0;
27                stats->ready.threads.migration = 0;
28                stats->ready.threads.extunpark = 0;
29                stats->ready.threads.threads   = 0;
30                stats->ready.threads.cthreads  = 0;
31                stats->ready.threads.preempt.yield  = 0;
32                stats->ready.threads.preempt.rllfwd = 0;
33                stats->ready.sleep.halts   = 0;
34                stats->ready.sleep.cancels = 0;
35                stats->ready.sleep.early   = 0;
36                stats->ready.sleep.wakes   = 0;
37                stats->ready.sleep.seen    = 0;
38                stats->ready.sleep.exits   = 0;
39
40                #if defined(CFA_HAVE_LINUX_IO_URING_H)
41                        stats->io.alloc.fast        = 0;
42                        stats->io.alloc.slow        = 0;
43                        stats->io.alloc.fail        = 0;
44                        stats->io.alloc.revoke      = 0;
45                        stats->io.alloc.block       = 0;
46                        stats->io.submit.fast       = 0;
47                        stats->io.submit.slow       = 0;
48                        stats->io.flush.external    = 0;
49                        stats->io.flush.dirty       = 0;
50                        stats->io.flush.full        = 0;
51                        stats->io.flush.idle        = 0;
52                        stats->io.flush.eager       = 0;
53                        stats->io.calls.flush       = 0;
54                        stats->io.calls.submitted   = 0;
55                        stats->io.calls.drain       = 0;
56                        stats->io.calls.completed   = 0;
57                        stats->io.calls.errors.busy = 0;
58                        stats->io.ops.sockread      = 0;
59                        stats->io.ops.epllread      = 0;
60                        stats->io.ops.sockwrite     = 0;
61                        stats->io.ops.epllwrite     = 0;
62                #endif
63
64                #if defined(CFA_STATS_ARRAY)
65                        stats->array.values = alloc(CFA_STATS_ARRAY);
66                        stats->array.cnt = 0;
67                #endif
68        }
69
70        static inline void tally_one( volatile uint64_t * agg, volatile uint64_t * val) {
71                uint64_t add = __atomic_exchange_n(val, 0_l64u, __ATOMIC_RELAXED);
72                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
73        }
74
75        static inline void tally_one( volatile int64_t * agg, volatile int64_t * val) {
76                int64_t add = __atomic_exchange_n(val, 0_l64, __ATOMIC_RELAXED);
77                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
78        }
79
80        void __tally_stats( struct __stats_t * cltr, struct __stats_t * proc ) {
81                tally_one( &cltr->ready.push.local.attempt    , &proc->ready.push.local.attempt     );
82                tally_one( &cltr->ready.push.local.success    , &proc->ready.push.local.success     );
83                tally_one( &cltr->ready.push.share.attempt    , &proc->ready.push.share.attempt     );
84                tally_one( &cltr->ready.push.share.success    , &proc->ready.push.share.success     );
85                tally_one( &cltr->ready.push.extrn.attempt    , &proc->ready.push.extrn.attempt     );
86                tally_one( &cltr->ready.push.extrn.success    , &proc->ready.push.extrn.success     );
87                tally_one( &cltr->ready.pop.local .attempt    , &proc->ready.pop.local .attempt     );
88                tally_one( &cltr->ready.pop.local .success    , &proc->ready.pop.local .success     );
89                tally_one( &cltr->ready.pop.help  .attempt    , &proc->ready.pop.help  .attempt     );
90                tally_one( &cltr->ready.pop.help  .success    , &proc->ready.pop.help  .success     );
91                tally_one( &cltr->ready.pop.steal .attempt    , &proc->ready.pop.steal .attempt     );
92                tally_one( &cltr->ready.pop.steal .success    , &proc->ready.pop.steal .success     );
93                tally_one( &cltr->ready.pop.search.attempt    , &proc->ready.pop.search.attempt     );
94                tally_one( &cltr->ready.pop.search.success    , &proc->ready.pop.search.success     );
95                tally_one( &cltr->ready.threads.migration     , &proc->ready.threads.migration      );
96                tally_one( &cltr->ready.threads.extunpark     , &proc->ready.threads.extunpark      );
97                tally_one( &cltr->ready.threads.threads       , &proc->ready.threads.threads        );
98                tally_one( &cltr->ready.threads.cthreads      , &proc->ready.threads.cthreads       );
99                tally_one( &cltr->ready.threads.preempt.yield , &proc->ready.threads.preempt.yield  );
100                tally_one( &cltr->ready.threads.preempt.rllfwd, &proc->ready.threads.preempt.rllfwd );
101                tally_one( &cltr->ready.sleep.halts           , &proc->ready.sleep.halts            );
102                tally_one( &cltr->ready.sleep.cancels         , &proc->ready.sleep.cancels          );
103                tally_one( &cltr->ready.sleep.early           , &proc->ready.sleep.early            );
104                tally_one( &cltr->ready.sleep.wakes           , &proc->ready.sleep.wakes            );
105                tally_one( &cltr->ready.sleep.seen            , &proc->ready.sleep.wakes            );
106                tally_one( &cltr->ready.sleep.exits           , &proc->ready.sleep.exits            );
107
108                #if defined(CFA_HAVE_LINUX_IO_URING_H)
109                        tally_one( &cltr->io.alloc.fast       , &proc->io.alloc.fast        );
110                        tally_one( &cltr->io.alloc.slow       , &proc->io.alloc.slow        );
111                        tally_one( &cltr->io.alloc.fail       , &proc->io.alloc.fail        );
112                        tally_one( &cltr->io.alloc.revoke     , &proc->io.alloc.revoke      );
113                        tally_one( &cltr->io.alloc.block      , &proc->io.alloc.block       );
114                        tally_one( &cltr->io.submit.fast      , &proc->io.submit.fast       );
115                        tally_one( &cltr->io.submit.slow      , &proc->io.submit.slow       );
116                        tally_one( &cltr->io.flush.external   , &proc->io.flush.external    );
117                        tally_one( &cltr->io.flush.dirty      , &proc->io.flush.dirty       );
118                        tally_one( &cltr->io.flush.full       , &proc->io.flush.full        );
119                        tally_one( &cltr->io.flush.idle       , &proc->io.flush.idle        );
120                        tally_one( &cltr->io.flush.eager      , &proc->io.flush.eager       );
121                        tally_one( &cltr->io.calls.flush      , &proc->io.calls.flush       );
122                        tally_one( &cltr->io.calls.submitted  , &proc->io.calls.submitted   );
123                        tally_one( &cltr->io.calls.drain      , &proc->io.calls.drain       );
124                        tally_one( &cltr->io.calls.completed  , &proc->io.calls.completed   );
125                        tally_one( &cltr->io.calls.errors.busy, &proc->io.calls.errors.busy );
126                        tally_one( &cltr->io.ops.sockread     , &proc->io.ops.sockread      );
127                        tally_one( &cltr->io.ops.epllread     , &proc->io.ops.epllread      );
128                        tally_one( &cltr->io.ops.sockwrite    , &proc->io.ops.sockwrite     );
129                        tally_one( &cltr->io.ops.epllwrite    , &proc->io.ops.epllwrite     );
130                #endif
131        }
132
133        #define eng3(X) (ws(3, 3, unit(eng( X ))))
134
135        void __print_stats( struct __stats_t * stats, int flags, const char * type, const char * name, void * id ) with( *stats ) {
136
137                char buf[1024];
138                ostrstream sstr = { buf, 1024 };
139
140                if( flags & CFA_STATS_READY_Q ) {
141
142                        sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - Ready Q Stats -----";
143
144                        uint64_t totalR = ready.pop.local.success + ready.pop.help.success + ready.pop.steal.success + ready.pop.search.success;
145                        uint64_t totalS = ready.push.local.success + ready.push.share.success + ready.push.extrn.success;
146                        sstr | "- totals   : " | eng3(totalR) | "run," | eng3(totalS) | "schd (" | eng3(ready.push.extrn.success) | "ext,"
147                             | eng3(ready.threads.migration) | "mig," | eng3(ready.threads.extunpark) | " eupk," | ready.threads.threads | " t," | ready.threads.cthreads | " cthr)";
148
149                        double push_len = ((double)ready.push.local.attempt + ready.push.share.attempt + ready.push.extrn.attempt) / totalS;
150                        double sLcl_len = ready.push.local.success ? ((double)ready.push.local.attempt) / ready.push.local.success : 0;
151                        double sOth_len = ready.push.share.success ? ((double)ready.push.share.attempt) / ready.push.share.success : 0;
152                        double sExt_len = ready.push.extrn.success ? ((double)ready.push.extrn.attempt) / ready.push.extrn.success : 0;
153                        sstr | "- push avg : " | ws(3, 3, push_len)
154                             | "- l: " | eng3(ready.push.local.attempt) | " (" | ws(3, 3, sLcl_len) | ")"
155                             | ", s: " | eng3(ready.push.share.attempt) | " (" | ws(3, 3, sOth_len) | ")"
156                             | ", e: " | eng3(ready.push.extrn.attempt) | " (" | ws(3, 3, sExt_len) | ")";
157
158                        double rLcl_pc = (100.0 * (double)ready.pop.local .success) / totalR;
159                        sstr | "- local    : " | eng3(ready.pop.local .success) | "-"| ws(3, 3, rLcl_pc) | '%'
160                             | " (" | eng3(ready.pop.local .attempt) | " try)";
161                        double rHlp_pc = (100.0 * (double)ready.pop.help  .success) / totalR;
162                        sstr | "- help     : " | eng3(ready.pop.help  .success) | "-"| ws(3, 3, rHlp_pc) | '%'
163                             | " (" | eng3(ready.pop.help  .attempt) | " try)";
164                        double rStl_pc = (100.0 * (double)ready.pop.steal .success) / totalR;
165                        sstr | "- steal    : " | eng3(ready.pop.steal .success) | "-"| ws(3, 3, rStl_pc) | '%'
166                             | " (" | eng3(ready.pop.steal .attempt) | " try)";
167                        double rSch_pc = (100.0 * (double)ready.pop.search.success) / totalR;
168                        sstr | "- search   : " | eng3(ready.pop.search.success) | "-"| ws(3, 3, rSch_pc) | '%'
169                             | " (" | eng3(ready.pop.search.attempt) | " try)";
170
171                        sstr | "- Idle Slp : " | eng3(ready.sleep.halts) | "halt," | eng3(ready.sleep.cancels) | "cancel,"
172                             | eng3(ready.sleep.wakes + ready.sleep.early) | '(' | eng3(ready.sleep.early) | ',' | eng3(ready.sleep.seen) | ')' | " wake(early, seen),"
173                             | eng3(ready.sleep.exits) | "exit";
174                        sstr | "- Preemption : " | eng3(ready.threads.preempt.yield) | "yields," | eng3(ready.threads.preempt.rllfwd) | "delayed";
175                        sstr | nl;
176                }
177
178                #if defined(CFA_HAVE_LINUX_IO_URING_H)
179                        if( flags & CFA_STATS_IO ) {
180                                sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - I/O Stats -----";
181
182                                uint64_t total_allocs = io.alloc.fast + io.alloc.slow;
183
184                                uint64_t total_submits = io.submit.fast + io.submit.slow;
185                                sstr | "- totals : allc" | eng3(io.alloc .fast) | nonl;
186                                if(io.alloc.slow) {
187                                        double avgfasta = (100.0 * (double)io.alloc.fast) / total_allocs;
188                                        sstr | "fast," | eng3(io.alloc .slow) | "slow (" | ws(3, 3, avgfasta) | "%)" | nonl;
189                                }
190                                sstr | " - subm" | eng3(io.submit.fast) | nonl;
191                                if(io.alloc.slow) {
192                                        double avgfasts = (100.0 * (double)io.submit.fast) / total_submits;
193                                        sstr | "fast," | eng3(io.submit.slow) | "slow (" | ws(3, 3, avgfasts) | "%)" | nonl;
194                                }
195                                sstr | nl;
196
197                                if(io.alloc.fail || io.alloc.revoke || io.alloc.block)
198                                        sstr | "-     failures      : " | eng3(io.alloc.fail) | "oom, " | eng3(io.alloc.revoke) | "rvk, " | eng3(io.alloc.block) | "blk";
199                                // if(io.flush.external)
200                                //      sstr | "- flush external    : " | eng3(io.flush.external);
201
202                                double avgsubs = ((double)io.calls.submitted) / io.calls.flush;
203                                double avgcomp = ((double)io.calls.completed) / io.calls.drain;
204                                sstr | "- syscll : "
205                                     |   " sub " | eng3(io.calls.submitted) | "/" | eng3(io.calls.flush) | "(" | ws(3, 3, avgsubs) | "/flush)"
206                                     | " - cmp " | eng3(io.calls.completed) | "/" | eng3(io.calls.drain) | "(" | ws(3, 3, avgcomp) | "/drain)"
207                                     | " - " | eng3(io.calls.errors.busy) | " EBUSY";
208                                sstr | " - sub: " | eng3(io.flush.full) | "full, " | eng3(io.flush.dirty) | "drty, " | eng3(io.flush.idle) | "idle, " | eng3(io.flush.eager) | "eagr, " | eng3(io.flush.external) | "ext";
209                                sstr | "- ops blk: "
210                                     |   " sk rd: " | eng3(io.ops.sockread)  | "epll: " | eng3(io.ops.epllread)
211                                     |   " sk wr: " | eng3(io.ops.sockwrite) | "epll: " | eng3(io.ops.epllwrite);
212                                sstr | nl;
213                        }
214                #endif
215
216                if(flags) write( sstr, stdout );
217        }
218
219        #if defined(CFA_STATS_ARRAY)
220                extern "C" {
221                        #include <stdio.h>
222                        #include <errno.h>
223                        #include <sys/stat.h>
224                        #include <fcntl.h>
225                }
226
227                void __flush_stat( struct __stats_t * this, const char * name, void * handle) {
228                        int ret = mkdir(".cfadata", 0755);
229                        if(ret < 0 && errno != EEXIST) abort("Failed to create directory .cfadata: %d\n", errno);
230
231                        char filename[100];
232                        snprintf(filename, 100, ".cfadata/%s%p.data", name, handle);
233
234                        int fd = open(filename, O_WRONLY | O_APPEND | O_CREAT, 0644);
235                        if(fd < 0) abort("Failed to create file %s: %d\n", filename, errno);
236
237                        for(i; this->array.cnt) {
238                                char line[100];
239                                size_t n = snprintf(line, 100, "%llu, %lld\n", this->array.values[i].ts, this->array.values[i].value);
240                                write(fd, line, n);
241                        }
242
243                        this->array.cnt = 0;
244                        close(fd);
245                }
246
247                static __spinlock_t stats_lock;
248
249                void __push_stat( struct __stats_t * this, int64_t value, bool external, const char * name, void * handle ) {
250                        if(external) lock(stats_lock __cfaabi_dbg_ctx2);
251
252                        if( this->array.cnt >= CFA_STATS_ARRAY ) __flush_stat( this, name, handle );
253
254                        size_t idx = this->array.cnt;
255                        this->array.cnt++;
256
257                        if(external) unlock(stats_lock);
258
259                        this->array.values[idx].ts = rdtscl();
260                        this->array.values[idx].value = value;
261                }
262        #endif
263#endif
Note: See TracBrowser for help on using the repository browser.