wip
This commit is contained in:
parent
f8c7745fbf
commit
19e86797d9
3 changed files with 42 additions and 2 deletions
Binary file not shown.
|
@ -79,8 +79,7 @@ old analysis to understand even better the causes of failures and how to prevent
|
||||||
them. Additionally, this report will provide an overview on the data engineering
|
them. Additionally, this report will provide an overview on the data engineering
|
||||||
tecniques used to perform the queries and analyses on the 2019 traces.
|
tecniques used to perform the queries and analyses on the 2019 traces.
|
||||||
|
|
||||||
\hypertarget{state-of-the-art}{%
|
\section{Background information}
|
||||||
\section{State of the Art}\label{state-of-the-art}}
|
|
||||||
|
|
||||||
\hypertarget{introduction}{%
|
\hypertarget{introduction}{%
|
||||||
\subsection{Introduction}\label{introduction}}
|
\subsection{Introduction}\label{introduction}}
|
||||||
|
|
41
report/sistemare.txt
Normal file
41
report/sistemare.txt
Normal file
|
@ -0,0 +1,41 @@
|
||||||
|
- abstract da rifare una volta scritto il paper
|
||||||
|
- dare una conclusione
|
||||||
|
|
||||||
|
- introduction
|
||||||
|
- tracce 2009 google
|
||||||
|
- tracce 2019 non studiate per i fallimenti
|
||||||
|
- obiettivo studiare fallimenti 2019 da diverse prospettive e confrontare con 2011
|
||||||
|
|
||||||
|
- come studiare i fallimenti
|
||||||
|
- impatto in tempo/spazio fallimenti
|
||||||
|
- modellare fallimenti (come riprodurre/studiare statisticamente fallimenti)
|
||||||
|
- trovare i motivi dei fallimenti (correlazioni che dipendono da task/job/macchine che causano piu' fallimenti)
|
||||||
|
|
||||||
|
- contribution:
|
||||||
|
- perche' sto progetto e' utile
|
||||||
|
|
||||||
|
- challenges:
|
||||||
|
- ci sono tanti dati, tempo CPU, spark
|
||||||
|
|
||||||
|
- outline:
|
||||||
|
- descrivere struttura report
|
||||||
|
|
||||||
|
- figura 1: statistiche generali (motivare che i task sono tanti, i job sono tanti)
|
||||||
|
|
||||||
|
- scaletta:
|
||||||
|
- Sezione 2: background information
|
||||||
|
- COME SONO FATTE LE TRACCE?
|
||||||
|
- Cosa sono Job, task, eventi fallimenti
|
||||||
|
- Definire termine failure and execution
|
||||||
|
|
||||||
|
- C'e' un datacenter, ci sono 8 cluster in posti diversi,
|
||||||
|
- Le macchine sono cosi: machine_configs
|
||||||
|
- Come funziona borg? tu mandi job (tipo Dockerfile). Job fatti da
|
||||||
|
task, job e task subiscono eventi (cambiamento di job e task).
|
||||||
|
Eventi sono di tanti tipi ma ci interessano questi: (EVICT FAIL FINISH KILL (non lost))
|
||||||
|
|
||||||
|
Figure separate per TUTTI I CLUSER e cluster separati
|
||||||
|
|
||||||
|
LEVARE DALLE FIGURE LOST E NO_TERM
|
||||||
|
(Eccezione unknown machine_time_waste)
|
||||||
|
|
Loading…
Reference in a new issue