Pengertian Disaster Recovery Plan
Disaster recovery plan merupakan sebuah prosedur penyelamatan dan pemulihan khususnya
fasilitas IT dan sistem informasi yang berisikan tindakan-tindakan konsisten
yang harus dilakukan sebelum, selama, dan setelah adanya kejadian (bencana)
yang mengakibatkan hilangnya sumber daya sistem informasi.
Menurut Brooks (2002:9) Disaster recovery plan merupakan rencana yang difokuskan pada pengunaan IT untuk
pemulihan kinerja sistem, aplikasi, atau sebuah fasilitas komputer yang
dijalankan dari suatu tempat yang berbeda (off-site)
ketika terjadi situasi darurat. Biasanya DRP berisikan analisis bisnis proses
dan apa saja yang dibutuhkan untuk melanjutkan bisnis kedepannya.
Menurut Rosenberg (2006:4) ada 10 langkah dalam menjalankan Disaster Recovery Plan,
yaitu:
1. Define key assets, threats and scenarios
2. Determine the recovery window
3. Defining
recovery solutions
4. Draft
a disaster recovery plan
5. Establish
a communications plan and assign roles
6. Disaster
recovery site planning
7. Accessing
data and applications
8. Document
the disaster recovery plan, in detail
9. Test
the disaster recovery plan
10. Refine
and retest the disaster recovery plan
Define
key Assets, Threats and Scenarios
Langkah pertama dalam pembuatan DRP adalah
mengidentifikasi aset-aset penting organisasi dan dampak apa yang ditimbulkan
apabila aset tersebut hilang. Langkah ini penting karena organisasi harus
mengetahui apa yang dilindungi dan apa value
nya terhadap proses bisnis, sehingga organisasi dapat mengetahui cara paling
tepat untuk melindunginya.
Contoh aset yang seharusnya dilindungi:
·
E-mail beserta archive
·
File dan dokumen yang ada di jaringan LAN
·
Desain dan spesifikasi
produk
·
Employee knowledge
·
Sistem accounting beserta komponen-komponennya
Determine
the Recovery Window
Setelah mengidentifikasi aset yang ada maka
berikutnya menentukan “recovery window”
yaitu, berapa lama organisasi dapat bertahan tanpa menggunakan sebuah aset.
Proses ini dilakukan pada setiap aset yang ada. Semakin cepat dibutuhkannya
sebuah aset untuk kembali dapat digunakan, maka akan semakin mahal biaya yang
harus dikeluarkan pada proses pemulihannya.
Defining
Recovery Solution
Langkah ketiga ini dibuat berdasarkan langkah
pertama dan kedua, dimana organisasi menentukan pendekatan dan solusi terbaik
yang akan dilakukan setelah mengetahui dampak yang ditimbulkan dari hilangnya
setiap aset dan lama waktu pemulihannya. Solusi yang bisa diambil seperti melakukan
backup data atau membuat copy data dan disimpan di sebuah lokasi off-site.
Draft
a Disaster Recovery Plan
Pada langkah ini berisikan bagaimana
organisasi akan melindungi setiap aset dan juga menetukan proses yang akan
dilakukan selanjutnya serta cara komunikasi yang akan digunakan selama disaster recovery berlangsung. Lebih
jauh lagi langkah ini akan membahas berapa besar kerusakan yang ditanggung dan
cara untuk meminimalisasi kerusakan.
Establish
a communications plan and assign roles
Langkah ini bertujuan untuk membuat
perencanaan komunikasi antar employee
maupun dengan customer dan menentukan
role dan kewajiban dari setiap anggota tim disaster
recovery. Komunikasi harus jelas dan tersedianya informasi kontak yang up-to-date dari setiap anggota tim,
serta adanya penentuan chain of command
sehingga komunikasi bisa berjalan teratur.
Disaster
Recovery Site Planning
Langkah berikutnya adalah menentukan “recovery site” yaitu, lokasi yang
ditujukan sebagai tempat menjalankan sistem yang digunakan dalam disaster recovery. Menentukan recovery site bertujuan untuk menghadapi
sebuah situasi dimana data center
yang menjadi lokasi utama penyimpanan data tidak dapat diakses. Terdapat 3
macam recovery site:
·
Hot site: lokasi recovery
site terhubung langsung dengan data
center utama dan sistem yang sudah siap, sehingga dapat langsung melakukan
replika data.
·
Warm site: hampir sama dengan hot site, namun membutuhkan waktu lebih lama untuk dapat melakukan
replika data, karena harus melakukan persiapan sistem terlebih dahulu seperti
instalasi software.
·
Cold site: hanya berupa lokasi yang dapat digunakan oleh
staff ketika dalam kondisi darurat. Tidak memiliki hardware, software maupun data.
Accessing
Data and Applications
Pada langkah ini organisasi menentukan metode
untuk mengkases data dan aplikasi pada data
center utama. Pemindahan data ke
recovery site dapat dilakukan secara manual, yang berarti tim disaster recovery harus segera menuju ke
recovery site. Penggunaan metode ini akan memakan biaya transportasi. Metode lain
adalah penggunaan web-server, dengan
menggunakan metode ini maka sebagian besar tim dapat menggunakan desktop atau laptop untuk mengakses VPN.
Document
the Disaster Recovery Plan, in Detail
Pada langkah ini penting untuk membuat planning yang lebih detail untuk dapat
melakukan pemindahan data ke recovery
site dengan benar. Elemen penting dalam Disaster
recovery plan adalah melakukan dokumentasi akan planning bagaimana data
akan dikembalikan ke sistem semula setelah data
center utama sudah kembali beroperasi, seperti melakukan synchronization data dan re-load server.
Test
Disaster Recovery Plan
Melakukan real
test bertujuan untuk menyiapkan staff
dalam menghadapi situasi darurat dan juga untuk mencari
kesalahan-kesalahan yang terdapat pada DRP. Test baik dilakukan berulang-ulang
sesuai dengan perubahan sistem dan proses bisnis organiasi.
Refine
and Re-Test the Disaster Recovery Plan
Tahap
terakhir adalah melakukan revisi sesuai dengan test yang sudah dilakukan
sebelumnya dan melakukan test kedua untuk menguji plan yang sudah direvisi. Langkah ini juga baik dilakukan
berulang-ulang untuk menyesuaikan
perubahan.
Tujuh Tier Disaster Recovery Strategies
Memahami disaster recovery
strategies and solutions kadang kadang dapat sangat sangat kompleks, untuk
membantu dalam mengkategorisasikan solusi solusi yang ada dan karakteristik
mereka (sebagai contoh biaya, recovery
time, recovery point capabilities)
definisi dari beberapa tingkat level dan komponen yang dibutuhkan dapat
dijelaskan secara benar. Ide dibalik klasifikasi yang ada ini dapat membantu
kita dalam mengetahui dan menentukan disaster
recovery yang diperhatikan.
- - Solusi apa yang dimiliki oleh mereka
- - Solusi apa yang dibutuhkan oleh mereka
- - Apakah mereka membutuhkan disaster recovery objective
yang jauh lebih tinggi
Pada tahun 1992, SHARE user grub
yang ada pada amerika serikat bekerja sama dengan IBM mendefinisikan 7 tier dari disaster recovery. Definisi dari tier tier yang ada telah didisain supaya disaster recovery yang muncul dapat dijelaskan dan dapat
diaplikasikan.
Tier tier yang ada pada gambar diatas akan menjelaskan karakteristik
dari masing masing tier tersebut dan biaya yang dibutuhkan, recovery time yang dibutuhkan juga
termasuk. Tujuan dari pengenalan tiap tier tier yang ada ini adalah untuk
menjelaskan pada mereka yang masih belum mengerti tentang disaster recovery, dan kemudian menghubungkan recovery tier yang
ada dengan strategi disaster recovery
yang ada.
Tier 0 – Do Nothing, No off-site data
Tier 0 didefinisikan sebagai single
data center environment yang tidak memiliki requirements untuk di backup
data atau mengimplementasikan disaster recovery plan.
Pada tier ini, tidak ada informasi yang harus disimpan, tidak ada
dokumentasi, tidak ada backup hardware,
dan contingency plan. Maka tidak ada
DR capability sama sekali. Tetapi menurut pengalaman, beberapa orang atau customer masih berada pada tier ini.
Sebagai contoh, ketika beberapa customer
secara aktif membuat backup pada data
mereka, backup mereka masih ditinggal
pada ruang komputer yang sama, atau kadang kadang tidak dipindahkan dari site
karena kurang teliti dalam prosedur penyimpanan. Customer data center yang ada
pada tier ini sangat besar kemungkinan untuk kehilangan data yang mereka miliki
dikarenakan tidak adanya backup data
yang mereka miliki, dan mereka memiliki resiko untuk tidak dapat mengembalikan business data mereka yang telah hilang.
Tier 1 – offsite vaulting (PTAM)
Tier 1 didefinisikan sebagai tier yang sudah memiliki DRP, backup atau penyimpanan data mereka pada
offsite storage facility dan telah
memiliki beberapa recovery requirements.
Backup data yang ingin disimpan
diambil dan dibawa ke tempat dimana data tersebut akan disimpan. Tetapi karena
penyimpanan dan pengambilan data ditangani oleh kurir, tier ini dideskripsikan
sebagai pickup truck access method
(PTAM). PTAM adalah metode yang digunakan oleh beberapa site, karena mereka
retatif murah .tetapi hal ini susah untuk diatur, hal ini karena susah untuk
mengetahui keberadaan data yang ingin disimpan tersebut.

Ketika beberapa customer yang
berada pada tier ini dan terlihat mampu untuk melakukan recovery data yang ada
ketika terjadi bencana.Tetapi 1 hal yang sering menjadi perhatian orang orang
adalah recovery time objective (RTO).Sebagai
contoh, ketika masih mungkin untuk melakukan recovery data, tetapi untuk
melakukan hal itu mungkin membutuhkan waktu selama beberapa hari atau beberapa
minggu.Ketidak adanya business data
pada periode selama ini dapat memberikan dampak pada business operation yang dapat bertahan sampai beberapa bulan atau
bahkan tahunan.
Tier 2 – Offsite vaulting with a hotsite (PTAM +
hotsite)
Tier 2 memiliki semua kebutuhan yang dimiliki oleh tier 1 (office vaulting, dan recovery planning) ditambah sebuat hotsite.Hotsite ini memiliki hardware
dan network infrastructure yang cukup
yang mampu untuk membantu instalasi pada
critical processing requirement.Tier 2 instalasi mengandalkan pada kurir
untuk melakukan kegiatannya (PTAM) untuk mengambil data pada fasilitas offsite storage.Ketika terjadi bencana,
data yang ada pada offsite storage
facility dipindahkan ke hotsite dan
dikembalikan ke dalam backup hardware
yang telah disediakan.Memindahkan data ke hotsite
meningkatkan biaya tetapi mengurangi recovery
time secara signifikan. Kunci yang ada pada hotsite ini adalah hardware
yang cukup untuk recover data ada dan
berfungsi secara benar.
Tier 3 – Electronic vaulting
Tier 3 memiliki semua komponen yang dimiliki oleh tier 2 (offsite backup, disaster recovery plan, hotsite) dan sebagai tambahan, ditambah
dengan penyimpanan elektronik terhadap beberapa subset yang ada pada beberapa
data.Penyimpanan elektronik terdiri dari electronically
transmitting dan membuat backup
pada fasilitas yang aman.Memindahkan business-critical
data offsite lebih cepat dan lebih sering daripada menggunakan data backup process yang dilakukan
secara tradisional. Hardware yang
akan menerima data harus secara fisik terpisah dengan site utama dan data yang disimpan untuk dilakukan recovery harus terjadi bencana terlebih
dahulu pada site utama. Data backup yang ada akan diambil dan
disimpan pada offsite storage facility.
Lalu ada juga hotsite yang siap dan backup data yang ada akan dikirimkan
kesana dari offsite storage facility.
Lalu ada juga electronic vaulting
terhadap data data yang kritikal yang ditransfer diantara site utama dengan hotsite.
Hotsite yang ada akan tetap berjalan secara permanen, yang mengakibatkan
naiknya biaya. Karena data data kritikal data yang telah disimpan pada hotsite, tetapi recovery time yang terjadi telah berkurang lagi secara signifikan.
Seringkali hotsite dari second data center dioperasikan oleh
perusahaan yang sama yang memiliki storage
service provider perusahaan itu sendiri.

Tier 4 – Electronic vaulting with hotsite (active
secondary site)
Tier 4 didefinisikan sebagai memiliki 2 data center dengan penyimpanan elektronik diantara 2 site dan memperkenalkan kebutuhan dari managemen
aktif data yang disimpan pada recovery
site.Hardware untuk penyimpanan
data harus secara fisik terpisah dari platform
utama. Backup dibawa dan data tersebut disimpan didalam offsite storage facility. Lalu ada hotsite yang siap dan data
backup dapat dikirimkan ke sana dari offsite
storage facility. Lalu ada juga transmisi data atau koneksi diantara site utama dengan hot site, yang didukung oleh high
bandwidth connections.
Pada scenario ini, beban kerja yang ada dibagi diatara 2 site tersebut.Ada transmisi data yang terus menerus diantara 2 site dengan kopian dari data yang
kritikal yang ada pada kedua site tersebut.Data data non kritikal yang ada pada
perusahaan tetap harus dipindahkan oleh kurir ke dalam offsite apabila terjadi bencana.
Tier 5 – two site two-phase commit
Tier 5 memiliki semua kebutuhan yang ada pada tier 4(offsite backup, disaster recovery plan,
electronic vaulting, dan active
secondary site) dan sebagai tambahannya, data yang dipilih akan dimaintain.
Tier 5 membutuhkan kedua site yang ada, baik itu primary dan secondary
platform data untuk terus
diupdate sebelum ada permintaan untuk melakukan update agar dapat berhasil.

Seperti gambar diatas, kedua site
yang ada telah tersinkronasisasi dengan menggunakan high bandwidth connection yang ada antara site utama dengan hotsite yang ada. Tier 5 juga membutuhkan hardware yang mumpuni pada hotsite
atau secondary platform dengan kemampuan untuk secara otomatis men transfer beban
kerja ke secondary platform. Kedua site yang ada ini telah
tersinkronisasi secara baik, data data kritikal yang ada dan aplikasi telah ada
pada kedua site dan hanya beberapa kecil data yang ditransfer yanh hilang
ketika terjadi bencana.Dengan sedikitnya jumlah data yang direcover dan koneksi
network sudah diimplementasikan, recovery time yang terjadi juga berkurang secara signifikan.
Tier 6 – zero data loss
Tier 6 meliputi tidak adanya kehilangan data, tier ini akan secara
langsung dan otomatis akan mentransfer data
ke secondary platform. Data dianggap hilang apabila transaksi sudah terlanjur
dimulai (sebagai contoh, seorang user
menekan tombol enter untuk melakukan
proses update), tetapi permintaan itu
belum dilaksanakan..tier 6 adalah disaster
recovery yang paling akhir. Data yang
ada dapat secara langsung mengkopi data yang ada pada 1 site ke secondary site dengan network switching capability.

Pada gambar diatas, kedua site ini sudah tersinkronisasi secara penuh
dengan menggunakan high bandwidth connection antara site
utama dengan hotsite. Kedua sistem
ini masing masing sudah terhubung secara sempurna, memungkinkan switchover otomatis dari 1 site ke site yang lain ketika dibutuhkan. Ini merupakan disaster recovery yang paling mahal karena membutuhkan coupling atau clustering applications, tambahan hardware untuk menyokong data replication,
dan high bandwidth connections
dengan jarak yang panjang. Tetapi hal ini juga menyediakan recovery yang paling cepat diantara tier tier yang lain.
Cost related to DR solutions
Disaster recovery bergerak maju dengan
tier yang lebih tinggi, biaya
perbaikan, biaya implementasi, ongoing
network cost, dan biaya maintenance
yang berkembang secara terus menerus. Sebagai contoh tier disaster recovery yang lebih tinggi membutuhkan :
- - Secondary site dengan
peralatan operasional yang redudansi, media, software, licensing, dan
staf yang mengelola secondary site tersebut
- - High bandwidth connections dengan jarak yang besar
- - Additional backup software modules untuk membantu fitur fitur advance
- - Coupling atau clustering
management software
- - Hardware yang membantu atau menyediakan point of time volume
copies atau remote data replication

Banyak dari tier tier yang telah dijelaskan telah mendeskripsikan dan
menjelaskan kemampuan untuk melakukan recover
dari data yang dimiliki oleh kita, perbedaan yang ada pada tiap tier adalah
seberapa cepat kita ingin melakukan recover
terhadap data yang kita miliki, baik itu beberapa minggu atau bahkan beberapa
menit (RTO), seberapa cepat kebutuhan
kita untuk melakukan recover terhadap
data yang kita miliki dilandasi oleh lingkungan kita, apakah kita berada pada
lingkungan yang membutuhkan data data yang sangat penting secara cepat atau
tidak, dan seberapa banyak data yang tidak ingin kita hilangkan (RPO). Karena itu, recovery solution harus
dipilih berdasarkan kriteria unik dari recoveri bisnis yang kita miliki, dan
seberapa banyak biaya yang akan hilang dari perusahaan kita karena down dan tidak dapat melanjutkan business processing pada perusahaan kita secara normal. Semakin pendek waktu
yang dibutuhkan untuk melakukan recovery
terhadap data yang kita miliki untuk melanjutkan proses bisnis secara normal,
semakin besar biaya yang kita butuhkan untuk melakukan hal itu. Dan hampir selalu,
semakin lama sebuah perusahaan tidak dapat mengembalikan proses transaksi yang
terjadi pada perusahaan itu, semakin besar dan mahal dampak yang akan terjadi
pada perusahaan tersebut.
Karena itu sangat penting untuk mengetahui bahwa biaya dari solusi untuk
melakukan disaster recovery harus masuk akal untuk
kebutuhan bisnis dari IT. Kita tidak akan mau mengeluarkan biaya yang lebih
besar pada Disaster Recovery solution daripada financial
loss yang akan kita dapatkan dari
bencana. Financial loss yang akan kita dapatkan harus
terlebih dahulu dipikirkan dan dianalisa dari awal awal ketika kita memiliki
pengalaman ketika terjadi bencana tersebut, business
impact analysis, penaksiran dampak, dan perencanaan yang hati-hati.
Tidak ada keraguan bahwa data yang kita miliki sangat penting dan dapat
menyebabkan hilangnya banyak data. Pada beberapa kasus, seperti instansi
keuangan, seperti bank, perusahaan tersebut harus
mengimplementasikan disaster protections
and recoverability yang paling tinggi untuk menanggulangi kerugian yang
akan terjadi apabila terjadi sebuah bencana.