source: libcfa/src/concurrency/stats.cfa @ a488783

ADTast-experimentalenumforall-pointer-decaypthread-emulationqualifiedEnum
Last change on this file since a488783 was 7cf3b1d, checked in by Thierry Delisle <tdelisle@…>, 3 years ago

Added level of indirection to idle sleeps which helps statistics.

  • Property mode set to 100644
File size: 11.4 KB
Line 
1#include <stdint.h>
2#include <stdlib.hfa>
3
4#include <unistd.h>                                                             // STDERR_FILENO
5#include <inttypes.h>
6#include "bits/debug.hfa"
7#include "bits/locks.hfa"
8#include "stats.hfa"
9#include "strstream.hfa"
10
11#if !defined(__CFA_NO_STATISTICS__)
12        void __init_stats( struct __stats_t * stats ) {
13                stats->ready.push.local.attempt = 0;
14                stats->ready.push.local.success = 0;
15                stats->ready.push.share.attempt = 0;
16                stats->ready.push.share.success = 0;
17                stats->ready.push.extrn.attempt = 0;
18                stats->ready.push.extrn.success = 0;
19                stats->ready.pop.local .attempt = 0;
20                stats->ready.pop.local .success = 0;
21                stats->ready.pop.help  .attempt = 0;
22                stats->ready.pop.help  .success = 0;
23                stats->ready.pop.steal .attempt = 0;
24                stats->ready.pop.steal .success = 0;
25                stats->ready.pop.search.attempt = 0;
26                stats->ready.pop.search.success = 0;
27                stats->ready.threads.migration = 0;
28                stats->ready.threads.extunpark = 0;
29                stats->ready.threads.threads   = 0;
30                stats->ready.threads.cthreads  = 0;
31                stats->ready.sleep.halts   = 0;
32                stats->ready.sleep.cancels = 0;
33                stats->ready.sleep.early   = 0;
34                stats->ready.sleep.wakes   = 0;
35                stats->ready.sleep.seen    = 0;
36                stats->ready.sleep.exits   = 0;
37
38                #if defined(CFA_HAVE_LINUX_IO_URING_H)
39                        stats->io.alloc.fast        = 0;
40                        stats->io.alloc.slow        = 0;
41                        stats->io.alloc.fail        = 0;
42                        stats->io.alloc.revoke      = 0;
43                        stats->io.alloc.block       = 0;
44                        stats->io.submit.fast       = 0;
45                        stats->io.submit.slow       = 0;
46                        stats->io.flush.external    = 0;
47                        stats->io.calls.flush       = 0;
48                        stats->io.calls.submitted   = 0;
49                        stats->io.calls.drain       = 0;
50                        stats->io.calls.completed   = 0;
51                        stats->io.calls.errors.busy = 0;
52                        stats->io.ops.sockread      = 0;
53                        stats->io.ops.epllread      = 0;
54                        stats->io.ops.sockwrite     = 0;
55                        stats->io.ops.epllwrite     = 0;
56                #endif
57
58                #if defined(CFA_STATS_ARRAY)
59                        stats->array.values = alloc(CFA_STATS_ARRAY);
60                        stats->array.cnt = 0;
61                #endif
62        }
63
64        static inline void tally_one( volatile uint64_t * agg, volatile uint64_t * val) {
65                uint64_t add = __atomic_exchange_n(val, 0_l64u, __ATOMIC_RELAXED);
66                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
67        }
68
69        static inline void tally_one( volatile int64_t * agg, volatile int64_t * val) {
70                int64_t add = __atomic_exchange_n(val, 0_l64, __ATOMIC_RELAXED);
71                __atomic_fetch_add(agg, add, __ATOMIC_RELAXED);
72        }
73
74        void __tally_stats( struct __stats_t * cltr, struct __stats_t * proc ) {
75                tally_one( &cltr->ready.push.local.attempt, &proc->ready.push.local.attempt );
76                tally_one( &cltr->ready.push.local.success, &proc->ready.push.local.success );
77                tally_one( &cltr->ready.push.share.attempt, &proc->ready.push.share.attempt );
78                tally_one( &cltr->ready.push.share.success, &proc->ready.push.share.success );
79                tally_one( &cltr->ready.push.extrn.attempt, &proc->ready.push.extrn.attempt );
80                tally_one( &cltr->ready.push.extrn.success, &proc->ready.push.extrn.success );
81                tally_one( &cltr->ready.pop.local .attempt, &proc->ready.pop.local .attempt );
82                tally_one( &cltr->ready.pop.local .success, &proc->ready.pop.local .success );
83                tally_one( &cltr->ready.pop.help  .attempt, &proc->ready.pop.help  .attempt );
84                tally_one( &cltr->ready.pop.help  .success, &proc->ready.pop.help  .success );
85                tally_one( &cltr->ready.pop.steal .attempt, &proc->ready.pop.steal .attempt );
86                tally_one( &cltr->ready.pop.steal .success, &proc->ready.pop.steal .success );
87                tally_one( &cltr->ready.pop.search.attempt, &proc->ready.pop.search.attempt );
88                tally_one( &cltr->ready.pop.search.success, &proc->ready.pop.search.success );
89                tally_one( &cltr->ready.threads.migration , &proc->ready.threads.migration  );
90                tally_one( &cltr->ready.threads.extunpark , &proc->ready.threads.extunpark  );
91                tally_one( &cltr->ready.threads.threads   , &proc->ready.threads.threads    );
92                tally_one( &cltr->ready.threads.cthreads  , &proc->ready.threads.cthreads   );
93                tally_one( &cltr->ready.sleep.halts       , &proc->ready.sleep.halts        );
94                tally_one( &cltr->ready.sleep.cancels     , &proc->ready.sleep.cancels      );
95                tally_one( &cltr->ready.sleep.early       , &proc->ready.sleep.early        );
96                tally_one( &cltr->ready.sleep.wakes       , &proc->ready.sleep.wakes        );
97                tally_one( &cltr->ready.sleep.seen        , &proc->ready.sleep.wakes        );
98                tally_one( &cltr->ready.sleep.exits       , &proc->ready.sleep.exits        );
99
100                #if defined(CFA_HAVE_LINUX_IO_URING_H)
101                        tally_one( &cltr->io.alloc.fast       , &proc->io.alloc.fast        );
102                        tally_one( &cltr->io.alloc.slow       , &proc->io.alloc.slow        );
103                        tally_one( &cltr->io.alloc.fail       , &proc->io.alloc.fail        );
104                        tally_one( &cltr->io.alloc.revoke     , &proc->io.alloc.revoke      );
105                        tally_one( &cltr->io.alloc.block      , &proc->io.alloc.block       );
106                        tally_one( &cltr->io.submit.fast      , &proc->io.submit.fast       );
107                        tally_one( &cltr->io.submit.slow      , &proc->io.submit.slow       );
108                        tally_one( &cltr->io.flush.external   , &proc->io.flush.external    );
109                        tally_one( &cltr->io.calls.flush      , &proc->io.calls.flush       );
110                        tally_one( &cltr->io.calls.submitted  , &proc->io.calls.submitted   );
111                        tally_one( &cltr->io.calls.drain      , &proc->io.calls.drain       );
112                        tally_one( &cltr->io.calls.completed  , &proc->io.calls.completed   );
113                        tally_one( &cltr->io.calls.errors.busy, &proc->io.calls.errors.busy );
114                        tally_one( &cltr->io.ops.sockread     , &proc->io.ops.sockread      );
115                        tally_one( &cltr->io.ops.epllread     , &proc->io.ops.epllread      );
116                        tally_one( &cltr->io.ops.sockwrite    , &proc->io.ops.sockwrite     );
117                        tally_one( &cltr->io.ops.epllwrite    , &proc->io.ops.epllwrite     );
118                #endif
119        }
120
121        #define eng3(X) (ws(3, 3, unit(eng( X ))))
122
123        void __print_stats( struct __stats_t * stats, int flags, const char * type, const char * name, void * id ) with( *stats ) {
124
125                char buf[1024];
126                ostrstream sstr = { buf, 1024 };
127
128                if( flags & CFA_STATS_READY_Q ) {
129
130                        sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - Ready Q Stats -----";
131
132                        uint64_t totalR = ready.pop.local.success + ready.pop.help.success + ready.pop.steal.success + ready.pop.search.success;
133                        uint64_t totalS = ready.push.local.success + ready.push.share.success + ready.push.extrn.success;
134                        sstr | "- totals   : " | eng3(totalR) | "run," | eng3(totalS) | "schd (" | eng3(ready.push.extrn.success) | "ext,"
135                             | eng3(ready.threads.migration) | "mig," | eng3(ready.threads.extunpark) | " eupk," | ready.threads.threads | " t," | ready.threads.cthreads | " cthr)";
136
137                        double push_len = ((double)ready.push.local.attempt + ready.push.share.attempt + ready.push.extrn.attempt) / totalS;
138                        double sLcl_len = ready.push.local.success ? ((double)ready.push.local.attempt) / ready.push.local.success : 0;
139                        double sOth_len = ready.push.share.success ? ((double)ready.push.share.attempt) / ready.push.share.success : 0;
140                        double sExt_len = ready.push.extrn.success ? ((double)ready.push.extrn.attempt) / ready.push.extrn.success : 0;
141                        sstr | "- push avg : " | ws(3, 3, push_len)
142                             | "- l: " | eng3(ready.push.local.attempt) | " (" | ws(3, 3, sLcl_len) | ")"
143                             | ", s: " | eng3(ready.push.share.attempt) | " (" | ws(3, 3, sOth_len) | ")"
144                             | ", e: " | eng3(ready.push.extrn.attempt) | " (" | ws(3, 3, sExt_len) | ")";
145
146                        double rLcl_pc = (100.0 * (double)ready.pop.local .success) / totalR;
147                        sstr | "- local    : " | eng3(ready.pop.local .success) | "-"| ws(3, 3, rLcl_pc) | '%'
148                             | " (" | eng3(ready.pop.local .attempt) | " try)";
149                        double rHlp_pc = (100.0 * (double)ready.pop.help  .success) / totalR;
150                        sstr | "- help     : " | eng3(ready.pop.help  .success) | "-"| ws(3, 3, rHlp_pc) | '%'
151                             | " (" | eng3(ready.pop.help  .attempt) | " try)";
152                        double rStl_pc = (100.0 * (double)ready.pop.steal .success) / totalR;
153                        sstr | "- steal    : " | eng3(ready.pop.steal .success) | "-"| ws(3, 3, rStl_pc) | '%'
154                             | " (" | eng3(ready.pop.steal .attempt) | " try)";
155                        double rSch_pc = (100.0 * (double)ready.pop.search.success) / totalR;
156                        sstr | "- search   : " | eng3(ready.pop.search.success) | "-"| ws(3, 3, rSch_pc) | '%'
157                             | " (" | eng3(ready.pop.search.attempt) | " try)";
158
159                        sstr | "- Idle Slp : " | eng3(ready.sleep.halts) | "halt," | eng3(ready.sleep.cancels) | "cancel,"
160                             | eng3(ready.sleep.wakes + ready.sleep.early) | '(' | eng3(ready.sleep.early) | ',' | eng3(ready.sleep.seen) | ')' | " wake(early, seen),"
161                             | eng3(ready.sleep.exits) | "exit";
162                        sstr | nl;
163                }
164
165                #if defined(CFA_HAVE_LINUX_IO_URING_H)
166                        if( flags & CFA_STATS_IO ) {
167                                sstr | "----- " | type | " \"" | name | "\" (" | "" | id | "" | ") - I/O Stats -----";
168
169                                uint64_t total_allocs = io.alloc.fast + io.alloc.slow;
170
171                                uint64_t total_submits = io.submit.fast + io.submit.slow;
172                                sstr | "- totals : allc" | eng3(io.alloc .fast) | nonl;
173                                if(io.alloc.slow) {
174                                        double avgfasta = (100.0 * (double)io.alloc.fast) / total_allocs;
175                                        sstr | "fast," | eng3(io.alloc .slow) | "slow (" | ws(3, 3, avgfasta) | "%)" | nonl;
176                                }
177                                sstr | " - subm" | eng3(io.submit.fast) | nonl;
178                                if(io.alloc.slow) {
179                                        double avgfasts = (100.0 * (double)io.submit.fast) / total_submits;
180                                        sstr | "fast," | eng3(io.submit.slow) | "slow (" | ws(3, 3, avgfasts) | "%)" | nonl;
181                                }
182                                sstr | nl;
183
184                                if(io.alloc.fail || io.alloc.revoke || io.alloc.block)
185                                        sstr | "-     failures      : " | eng3(io.alloc.fail) | "oom, " | eng3(io.alloc.revoke) | "rvk, " | eng3(io.alloc.block) | "blk";
186                                if(io.flush.external)
187                                        sstr | "- flush external    : " | eng3(io.flush.external);
188
189                                double avgsubs = ((double)io.calls.submitted) / io.calls.flush;
190                                double avgcomp = ((double)io.calls.completed) / io.calls.drain;
191                                sstr | "- syscll : "
192                                     |   " sub " | eng3(io.calls.flush) | "/" | eng3(io.calls.submitted) | "(" | ws(3, 3, avgsubs) | "/flush)"
193                                     | " - cmp " | eng3(io.calls.drain) | "/" | eng3(io.calls.completed) | "(" | ws(3, 3, avgcomp) | "/drain)"
194                                     | " - " | eng3(io.calls.errors.busy) | " EBUSY";
195                                sstr | "- ops blk: "
196                                     |   " sk rd: " | eng3(io.ops.sockread)  | "epll: " | eng3(io.ops.epllread)
197                                     |   " sk wr: " | eng3(io.ops.sockwrite) | "epll: " | eng3(io.ops.epllwrite);
198                                sstr | nl;
199                        }
200                #endif
201
202                if(flags) write( sstr, stdout );
203        }
204
205        #if defined(CFA_STATS_ARRAY)
206                extern "C" {
207                        #include <stdio.h>
208                        #include <errno.h>
209                        #include <sys/stat.h>
210                        #include <fcntl.h>
211                }
212
213                void __flush_stat( struct __stats_t * this, const char * name, void * handle) {
214                        int ret = mkdir(".cfadata", 0755);
215                        if(ret < 0 && errno != EEXIST) abort("Failed to create directory .cfadata: %d\n", errno);
216
217                        char filename[100];
218                        snprintf(filename, 100, ".cfadata/%s%p.data", name, handle);
219
220                        int fd = open(filename, O_WRONLY | O_APPEND | O_CREAT, 0644);
221                        if(fd < 0) abort("Failed to create file %s: %d\n", filename, errno);
222
223                        for(i; this->array.cnt) {
224                                char line[100];
225                                size_t n = snprintf(line, 100, "%llu, %lld\n", this->array.values[i].ts, this->array.values[i].value);
226                                write(fd, line, n);
227                        }
228
229                        this->array.cnt = 0;
230                        close(fd);
231                }
232
233                static __spinlock_t stats_lock;
234
235                void __push_stat( struct __stats_t * this, int64_t value, bool external, const char * name, void * handle ) {
236                        if(external) lock(stats_lock __cfaabi_dbg_ctx2);
237
238                        if( this->array.cnt >= CFA_STATS_ARRAY ) __flush_stat( this, name, handle );
239
240                        size_t idx = this->array.cnt;
241                        this->array.cnt++;
242
243                        if(external) unlock(stats_lock);
244
245                        this->array.values[idx].ts = rdtscl();
246                        this->array.values[idx].value = value;
247                }
248        #endif
249#endif
Note: See TracBrowser for help on using the repository browser.