Ignore:
Timestamp:
Jun 4, 2025, 1:43:34 PM (4 months ago)
Author:
Michael Brooks <mlbrooks@…>
Branches:
master
Children:
f858ca5
Parents:
c8bdbaf
Message:

Recent rework of string benchmarks

File:
1 edited

Legend:

Unmodified
Added
Removed
  • doc/theses/mike_brooks_MMath/plots/common.py

    rc8bdbaf re0350e0  
    1717
    1818    dt[['corpus-basename',
    19         'corpus-ext']] = dt['corpus'].str.strip().str.split('.', expand=True)
     19        'corpus-ext']] = dt['corpus'].str.strip().str.rsplit('.', n=1, expand=True)
    2020    dt[['corpus-slug',
    21         'corpus-nstrs',
    22         'corpus-meanlen',
     21        'corpus-nstrs-tgt',
     22        'corpus-meanlen-tgt',
    2323        'corpus-runid']] = dt['corpus-basename'].str.strip().str.split('-', expand=True)
    24     dt["corpus-nstrs"] = pd.to_numeric(dt["corpus-nstrs"])
    25     dt["corpus-meanlen"] = pd.to_numeric(dt["corpus-meanlen"])
    26     dt["corpus-runid"] = pd.to_numeric(dt["corpus-runid"])
     24    dt["corpus-nstrs-tgt"] = pd.to_numeric(dt["corpus-nstrs-tgt"])
     25    dt["corpus-meanlen-tgt"] = pd.to_numeric(dt["corpus-meanlen-tgt"])
     26    dt[['corpus-relscale',
     27        'corpus-seed',
     28        'corpus-offset-instr']] = dt['corpus-runid'].str.strip().str.split('+', expand=True)
     29    dt["corpus-relscale"] = pd.to_numeric(dt["corpus-relscale"])
    2730
    2831def loadParseTimingData( infileLocal, xClasNames=[], xClasDtypes={}, xFactNames=[], xFactDtypes={} ):
     
    3235    timings = pd.read_csv(
    3336        infile,
    34         names=['test', 'corpus'] + xClasNames + [ 'concatsPerReset', 'corpusItemCount', 'corpusMeanLenChars', 'concatDoneActualCount', 'execTimeActualSec'] + xFactNames,
     37        names=['test', 'corpus'] + xClasNames + [ 'concatsPerReset', 'corpusItemCountAct', 'corpusMeanLenCharsAct', 'concatDoneActualCount', 'execTimeActualSec'] + xFactNames,
    3538        dtype={**xClasDtypes, **xFactDtypes, **{
    3639            'test':                  str,
    3740            'corpus':                str,
    3841            'concatsPerReset':       'Int64', # allows missing; https://stackoverflow.com/a/70626154
    39             'corpusItemCount':       np.int64,
    40             'corpusMeanLenChars':    np.float64,
     42            'corpusItemCountAct':    np.int64,
     43            'corpusMeanLenCharsAct': np.float64,
    4144            'concatDoneActualCount': np.int64,
    4245            'execTimeActualSec':     np.float64,
Note: See TracChangeset for help on using the changeset viewer.